정보&팁

무료 ocr 프로그램 추천

지니허니 2023. 11. 10. 12:16

오늘은 무료 ocr 프로그램에 대해 알아보려고합니다.

OCR이란 말그대로 단말기나 컴퓨터가 입력되는 이미지에서 문자를 판독하는 기술을 말하며 
스캔을 한 책은 이미지로 나오기 때문에 문자로 인식을 하기 위한 작업이며
현재 모든 OCR프로그램은 완벽하게 100% 다 문자인식을 해주지는 못합니다
또한 영문은 90% 이상의 인식률을 자랑하나
한글은 글자의 크기와 스캔품질 등의 이유로 최저 20% 최고 70%~ 정도의 인식만 되고 있습니다
OCR전문 업체들이 거의 외국인것을 감안하면 위에 저정도도 인식이 많이 되는 편입니다.
컴퓨터가 일일히 이미지에 글자를 읽어서 문자로 만들어주는것이기 때문에
당연히 완벽하진 못합니다 

그림에 글자를 직접 타이핑 치기에는 시간이 많이 걸립니다.
하지만 요즘은 pdf나 jpg파일에서 글자를 타이핑한 것처럼 인식하는
무료 OCR 프로그램이 있습니다.

OCR 프로그램이 별도로 있어야 합니다만,
한/글에서도 이 기능을 지원합니다.
즉 스캔한 파일이나 캡쳐된 사진을  한/글에 붙여 넣은 후
사진 위에서 마우스 우클릭하면 '그림에서 글자 가져오기' 메뉴가 있으니 그걸 선택하면 
그림 안에 있는 글자를 인식하여 줍니다.
인식이 끝난 후 ctrl+V를 누르면 텍스트가 별도로 나타나게 됩니다.
그러나 인식률이 썩 좋지는 않아요.

 

 

 

 

 



 

 

무료 OCR 텍스트 인식 프로그램

자주 보는 책을 스캔해서 텍스트로 바꿀때, 아주 유용합니다.
상용 OCR 프로그램이 없으신 분들에게는 더욱 필요할 것입니다.
gImage Reader는  
여느 상용 프로그램과 비교해도 손색이 없을 것입니다.
언어팩(설치시 선택) 제공으로 한글, 히브리어, 고대 그리스어도 인식이 가능합니다.
이미지 파일 뿐만아니라 PDF도 지원하구요.


 
gImage Reader 3.4.0 다운로드
http://sourceforge.net/projects/gimagereader/

gImage Reader  프로그램의 장점은 영어, 독일어, 프랑스어 등
중세 때 사용하던 글자로 인쇄된 책을 스캔, 인식시킬 때
그 진가를 발휘합니다.
다른 OCR로는 어림도 없습니다.

 

 

초록색 Download 버튼을 눌러  받으시면 됩니다.

 

 

 

그리고 받은 파일을 실행 해줍니다.

 

 

설치는 별거 없습니다. Next 만 눌러주면 됩니다.

 

 

I Agree 버튼을 눌러줍니다.

 

 

Next 를 눌러줍니다.

 

 

Next 버튼을 눌러줍니다.

 

 

그리고 Install 버튼을 눌러 줍니다.

 

 

설치하는 동안 잠시 기다려줍니다.

 

 

설치완료되었으면 Finish 버튼을 눌러줍니다.

 

시작에서 gImageReader 를 실행해줍니다.

 

 

 

빨간색으로 동그라미친 곳을 눌러 이미지 파일이나 pdf 파일을 불러옵니다.

 

 

 

불러온후 Recognize all 를 눌러줍니다.

 

 

그럼 이미지에서 텍스트 추출이 됩니다ㅏ^^

 

 

텍스트 파일로 저장하고싶으시면 빨간네모로 표시한 곳을 눌러 저장하시면됩니다.

 

 

#만약에 추출하는 문자가 영어가아니고 한글이면 한글언어팩을 추가해야합니다.

추가하는 방법은 다음과같습니다.

 

우측 상단에 빨간네모로 표시한곳을 누르고 Manage languages 를 눌러줍니다.

 

 

그럼 Tessdata Manager 창이 뜨는데 스크롤바를 아래쪽으로 내려보시면 

한국어 가 보이는데 체크후 Apply 를 눌러 적용후 Close 를 눌러 창을 닫아줍니다.

 

 

그런다음 다시 빨간네모로 표시한곳을 눌러 보면 한국어[kor] 가 추가된것을 볼 수 있습니다.

 선택해줍니다.

 

 

 

동그라미친곳을 눌러 추출할 이미지 파일이 pdf파일을 불러옵니다.

 

 

불러왔으면 Recognize all 버튼을 눌러줍니다.

 

 

그럼 우측에 텍스트로 추출이 됩니다..

 

 

이보다 더 인식율이 좋은 프로그램을 원하시면 상용 프로그램을 사용하셔야합니다.

예를 들어 Adobe Acrobat Pro라는 프로그램을 사용하면 그림 안의 글자를 인식할 수 있게 해 주는 기능이 제공됩니다.(유료 프로그램입니다.)
아크로뱃 - 괜찮은 정도입니다.
"도구" -> 스캔 및 OCR -> 텍스트 인식 ... 이런 식으로 인식하면 됩니다. 


그리고 아주 강력한 OCR 프로그램으로 ABBYY 사에서 만든 Fine Reader PDF 15라는 프로그램도 있는데, 옵션이 아크로뱃보다 더 많습니다. 
역시 유료 프로그램입니다.

 


아니면 알PDF 라는 프로그램도 있는데 개인무료로 사용할 수 있는 프로그램입니다.!
최근에는 이스트소프트에서 만든 알~ 시리즈 중 알Pdf를 사용해서 문자인식작업을 하신 분께서
한글만 들어있는 경우에는 인식률이 최고라고 하더군요.

 


안 그러면 온라인서도 이런 기능을 지원해 주는 사이트가 있습니다.
다만 분량이 제한되어 있고, 많이 하려면 비용을 지불해야 합니다.
아래 사이트를 참고로 확인해 보세요.
한글이 지원되는 사이트입니다.


https://www.i2ocr.com/free-online-korean-ocr

https://img2txt.com/en

https://www.onlineocr.net/


이외에도 OCR 글지인식 으로 검색해 보시면 원하시는 정보를 많이 얻으실 수 있을 겁니다.