2013-01-23

최강의 PDF 전자책 솔루션 ABBYY FineReader

 이달초 새로바뀐 업무분장으로 인해 책자를 2~3권 들고다니며 이동중에 보려고 했는데, 책이 A4사이즈라 부피와 무게감때문에 급 지름신이 방문해서 아이패드 미니를 지르게 되었다.

 마침 직장에 ADF(자동문서공급장치) 장치가 있는 복합기가 있어서 책을 절단기로 커버를 잘라낸뒤 연속으로 스캔을 시도해봤는데 생각만큼 깔끔하게 양면스캔이 되지 않았다..
아마도 스캐너 내부에서 앞면을 스캔한뒤 롤러를 통해 뒤집어 뒷면을 스캔하는 방식이라 좌우가 심하게 삐뚤게 스캔되기도 하고 접힌 부분은 용지걸림이 심하게 발생되었다.
결국 90페이지쯤 되는 책을 집에 있던 구형 HP 스캔젯 2300c를 통해 한장한장 손수(?) 스캔을 완료하여 개별 PDF파일을 하나의 PDF파일로 합쳤다.
그런데 전부 이미지 파일로 압축된 PDF파일이다보니 용량이 40MB를 넘어갔다, 그리고 OCR인식 처리를 하지않은탓에 문자 검색도 안되었다.

 ABBYY OCR프로그램을 알게되기 전에는 그냥 이렇게 불편하게라도 쓰자 생각했는데,
인터넷 검색으로 OCR 프로그램 추천사용기를 읽어본뒤 프로그램을 입수해 예제로 스캔떠놓은 PDF파일을 돌려보았더니 생각보다 길지않은 시간안에 OCR작업이 완료되어 문자검색이 되는 PDF, 게다가 용량까지 1/10으로 압축되었는데도 글자는 아래처럼 선명하게 더 잘보였다~


▷ OCR프로그램을 거쳐 글자가 더 선명하게 변하였다.
  물론 비트맵방식이라 한계가 있었지만 테두리처리만 되었을뿐인데 가독성은 훨씬 좋아졌다.



▷ 위 파일은 기존 스캔한 파일인데 문자검색이 안된다.
  OCR프로그램을 거치면 검색을 통해 문자를 찾을수 있다.



▷ 위 파일은 그냥 스캔하여 하나의 PDF로 만든 파일이고, 아래는 같은 내용의 파일을 OCR프로그램을 통해 작업을 한 파일이다. 1/10으로 용량까지 줄어들었다.



▷ ABBYY FineReader 11 Professional Edition을 사용하였다.



▷ ABBYY 본사 홈페이지 이동



▷ 한국 총판인듯한데 (주)레티아에서 판매중인 ABBYY 제품 가격이다. (2013년 1월 현재)
  사이트로 이동


댓글 없음: