안녕하세요. 박스캣입니다.
회사에서 업무를 진행하다 보면 보안 관련된 문제로 PDF파일을 많이 사용하게 됩니다. PDF파일은 편리하지만 내용 수정이 어렵다는 단점이 있는데요. 해당 단점은 PDF 변환 사이트를 이용하면 수정이 가능하긴 합니다. 하지만, 이미지를 스캔하여 PDF파일로 만든 경우에는 PDF 변환 사이트를 이용해도 텍스트 추출이 불가능한데요. 이럴 때에는 OCR 기능을 사용하여 텍스트만 따로 추출을 해줘야 합니다. 양이 적을 때는 그냥 타자 쳐도 되지만 양이 많은 경우에는 이번 포스팅이 굉장히 도움이 되실 겁니다.
오늘은 '이미지나 스캔한 PDF 파일에서 텍스트를 추출하는 방법'에 대해 알아보도록 하겠습니다.
[목차]
1. 알PDF 사용하기
2. 구글드라이브 사용하기(무료)
PDF 스캔 파일, 이미지 등에서 텍스트를 추출하는 방법에 대해 알아봅시다. (무료)
일반 문서를 PDF 파일로 변경한 경우에는 'PDF 변환 사이트'에서 hwp 파일이든 word 파일이든 원하는 대로 변환이 가능합니다. 하지만 문서를 스캔하여 이미지 처리가 된 파일에 대해서는 PDF 변환 사이트를 이용하더라도 소용이 없는데요. 대부분 한글이나 워드 프로그램에 이미지가 첨부된 형식으로 변환이 되실 겁니다. 이미지에서 글자를 추출하려면 다른 방법을 사용해야 하는데요. 무료로 간단하게 할 수 있는 방법에 대해 알아보겠습니다.
※텍스트 추출한 문서는 화질이나 다양한 이유로 인해 내용의 일부가 다를 수 있습니다. 텍스트 추출 후에 원본 파일과 꼭 비교해 보시기 바랍니다.
1. 알PDF 사용하기
첫 번째 방법은 알PDF 프로그램을 사용하는 방법입니다. 알 PDF프로그램은 알툴즈 홈페이지에서 무료로 다운로드가 가능합니다. 프로그램 설치를 원하시지 않는 분께서는 2번 방법을 참고하시기 바랍니다.
1) 알PDF 프로그램을 실행하고 해당 PDF 이미지 스캔 파일을 열어줍니다. 이미지 파일이기 때문에 따로 텍스트 지정이 되지 않는 것을 확인하실 수 있습니다.
2) '상단 홈 탭 → 문자인식(OCR)' 아이콘을 클릭합니다.
3) 아래와 같은 창이 나오면 '확인'을 클릭합니다.
4) 텍스트 지정이 가능한 파일로 변경된 것을 확인하실 수 있습니다.
2. 구글드라이브 사용하기(무료)
구글 자체의 'google 문서 기능'을 이용하면 텍스트의 추출이 가능합니다.
1) 구글 크롬 웹브라우저를 실행하여 로그인을 해주세요. 로그인 후 '우측 상단 아이콘 → 드라이브' 순으로 클릭합니다.
2) '좌측 내 드라이브 탭 → 내 드라이브 ▼아이콘 → 파일 업로드' 순으로 클릭합니다.
3) 파일의 업로드가 끝나면 업로드한 파일 우측의 '점 3개 아이콘 → 연결 앱 → Google 문서' 순을로 클릭합니다.
4) Google 문서가 실행이 되면서 해당 스캔 이미지 파일이 텍스트 지정이 가능한 상태로 변경된 것을 확인하실 수 있습니다.
이상으로 '이미지나 스캔한 PDF 파일에서 텍스트를 추출하는 방법'에 대해 알아보았습니다. 업무를 진행할 때 이미지 파일의 내용을 그대로 복사해야 하는 경우가 있는데요. 해당 방법을 사용하시면 무료로 빠르게 업무가 진행가능하실 겁니다. 작성한 포스팅 끝까지 읽어주셔서 감사드리며, 다음에는 더욱 알찬 내용으로 찾아뵙도록 하겠습니다.
'프로그램 & IT 상자' 카테고리의 다른 글
윈도우10 최근 항목 표시 제거 방법 (최근 사용한 파일 삭제하기) (1) | 2024.06.28 |
---|---|
카카오톡 받은 선물함 내역 삭제하는 방법 (카톡 받은 선물 삭제) (0) | 2024.05.20 |
구글 크롬 시작페이지 설정, 변경, 고정 방법 (여러 페이지 가능) (1) | 2024.05.10 |
쓰지않는 웹사이트 탈퇴하는 방법 (일괄, 개인정보포털) (1) | 2024.04.24 |
구글 플레이스토어 검색기록 삭제, 설치기록 삭제 (흔적 지우기) (1) | 2024.04.22 |
댓글