유틸리티

무료 OCR 텍스트 인식 프로그램 gImageReader

지니허니 2022. 1. 2. 02:13

오늘은 무료 OCR 텍스트 인식 프로그램 소개하려고합니다.
스캔한 PDF 파일, 이미지 파일 텍스트를 추출해내거나 자주 보는 책을 스캔해서 텍스트로 바꾸고싶을 때, 아주 유용합니다.
상용 OCR 프로그램이 없으신 분들에게는 더욱 필요할 것입니다.
아시는분들은 다아시겠지만 모르시는 분들이 더 많을거예요.
이름하여 gImageReader라는 프로그램인데요.
윈도우용 프로그램이고, 리눅스 버전도 있지만 리눅스는 쓰는사람이 별로 없기때문에 패스하고
gImageReader 라는 프로그램은 오픈소스로 , 소스코드도 공개되어있습니다.
프리웨어로 누구나 자유롭게 저작권 걱정없이 쓸 수 있는 프로그램입니다.
C언어로 개발된 프로그램이에요.  

특히 Tesseract OCR는 커맨드 라인 프로그램이지만, 
여느 상용 프로그램과 비교해도 손색이 없을 것입니다.
언어팩(설치시 선택) 제공으로 한글, 히브리어, 고대 그리스어도 인식이 가능합니다.
ABBYY Fine Reader 인식률이 좋지만 비싸기 때문에 ABBYY Fine Reader 대용으로 사용할 수 있어요.

이 gImageReader 프로그램의 장점은 영어, 독일어, 프랑스어 등
중세 때 사용하던 글자로 인쇄된 책을 스캔, 인식시킬 때
그 진가를 발휘합니다.
다른 OCR로는 어림도 없습니다.
인식이 백프로까진 아니지만 그래도 맑은 고딕체는 인식이 어느정도 잘되는거 같네요. 
궁서체는 인식이 잘안되는거 같구요.  
그리고 손글씨는 인식이 거의 안되네용

프로그램은 요렇게 생겼어요.


 
프로그램명 : gImageReader
 운영체제 : Windows 7, 8, 10 (32 bit & 64 bit)
 파일크기 : 32.0MB
 라이선스 : 프리웨어(개인/기업 모두 무료)
 
그럼 본른으로 들어가서 gImage Reader 다운 및 설치 간략한 사용법 까지 알아보죠.
   

먼저 gImage Reader 홈페이지 https://github.com/manisandro/gImageReader 여기로 들어가주세요.

 


사이트에 접속하시면 다음과같은 화면이 나오는데
우측에 빨간네모친 gImageReader-3.3.1 를 클릭해주세요.

 

 

그런다음 gImageReader_3.3.1_qt5_x86_64 링크를 눌러 다운받아주세요.
혹시 몰라 설치파일도 올려놓습니다.

블로그에서 파일첨부는 10Mb만 가능하기 때문에 4개로 나누어 첨부하였습니다.

알집으로 분할 압축했고 egg 파일은 알집, 반디집으로 압축풀수 있어요.

압축푸는 방법은 아래 첨부된 파일 파일 4개 모모두 다운받은후 gImageReader_3.3.1_qt5_x86_64.vol1 첫번째 파일만 압축풀면됩니다.

 

 

gImageReader_3.3.1_qt5_x86_64.vol1.egg
10.00MB
gImageReader_3.3.1_qt5_x86_64.vol2.egg
10.00MB
gImageReader_3.3.1_qt5_x86_64.vol3.egg
10.00MB
gImageReader_3.3.1_qt5_x86_64.vol4.egg
2.04MB



 

다운이 완료되면 다운로드 폴더에 보시면 이런 파일이 있을거에요.
실행해주세요.

 

파일이 실행 되면 Next 를 눌러 설치를 진행 합니다.

 

I Agree(동의) 버튼을 눌러 줍니다.

 

계속 Next 를 눌러줍니다.

 

계속 Next 를 눌러줍니다.

Install (설치) 를 눌러 진행 합니다.

 

설치는 10초정도 소요 됩니다.

 

설치가 끝났으면 Finish 를 눌러 창을 닫아줍니다..

 

시작 누르고 프로그램 목록에 보시면 gImageReader 설치된것을 볼 수 있습니다.
gImageReader 폴더를 클릭해주세요.

 

gImageReader에 오른쪽 마우스 클릭하고 자세히 -> 관리자 권한으로 실행 해주세요.

 

실행시키면 이런화면이 나올겁니다.
화살표 가리킨곳을 눌러 스캔한pdf파일이나 이미지 파일을 불러옵니다.

 

저는 예제로 캡쳐한 애국가 를 추출해보겠습니다.
파일을 불러왔으면 우측 상단에 빨간네모친 ▼ 를 눌러주세요.

 

그런다음 Manage languages 를 눌러주세요.
 

언어 선택창이 뜨면 목록에어 한국어[kor] 를 찾아 체크후 Apply 를 눌러주세요.
  

그런다음 다시▼ 누르고 한국어[kor] 를 선택해주세요.

 

그런 위에 그림과같이 같이 뜨는데 Install 을 눌러 주세요.

 

설치완료되면 메세지 창이 뜨는데 OK 를 눌러주세요.

 

자 이제 추출할 텍스트를 마우스로 드래그해서 선택 해줍니다.
선택후 상단에 Recognize selection(선택 항목 인식)눌러 주세요.

그럼 요렇게 텍스트로 추출이 됩니다...

 

Ctrl + A 해서 전체선택후 Ctrl + C 하면 복사 할 수 있어요.
또는 마우스로 드래그해서 원하는부분만 선택하고 오른쪽 마우스 클릭하면  위와같이 메뉴가 나오는데 Copy 를 누르면 복사 됩니다.

 

텍스트 파일로 저장하려면 위와깉이  Save output 를 누르면 TXT 파일로 저장할 수 있습니다.




파일저장창이 뜨면 저장위치를 지정하고 저장을 눌러주면 됩니다.
 

 

위에 보시는것과같이 
대부분ㅇ를 ㅁ로 인식하네요.ㅎㅎㅎ
동을 돔으로 
위에를 위메로
강산을 감산으로 ㅋㅋ

 

 영어 익식률은 좋지만 한글 인식률은 좀 떨어지는거같아요
그래도 이정도면 무료 OCR 프로그램 치고는 인식률이 꽤 좋습니다

아무튼 여기까지 무료 OCR 텍스트 인식 프로그램 gImageReader 대한 소개였습니다.