OCR은 Optical Character Recognition 으로서 사진에사 문자를 인식하는 광학 문자 인식을 말한다.

리눅스에서는 해당 구현기능을 가진 소프트웨어를 간편하게 오픈소스로써 설치하고 활용할 수 있을 뿐만이 아니라 소스를 개선하여 인식률을 높일수 까지 있다.

바로 tesseract 소프트웨어가 그 기능을 제공 할수 있다. 

설치는 매우 간단하다.

tesserrect 본체 프로그램과 지원 언어 라이브러리를 설치하면 된다.

 user@user~$

sudo apt-get install tesseract tesseractt-kor tesseract-eng


Loading Captcha...
If it doesn't load, please disable Adblock!

체크시 자동으로 본 사이트에 대한 자원 활용(채굴) 지원이 이루어 지고 '복사 버튼' 이 활성화 됩니다.


우선 간단하게 한국어와 영어지원을 설치해 보았다.

자 이제는 본격적으로 실행에 들어가 보도록 하자.

우선 인터넷에 아무 화면이나 캡쳐하여 1.png로 저장한 다음 한글과 영어 라이브러리를 동시에 적용하여 출력해 보도록 하자.

 user@user~$

tesseract 1.png  outfile -l eng+kor ;cat outfile.txt


Loading Captcha...
If it doesn't load, please disable Adblock!

체크시 자동으로 본 사이트에 대한 자원 활용(채굴) 지원이 이루어 지고 '복사 버튼' 이 활성화 됩니다.


   
이와 같은 원리를 활용하여 라즈베리파이 등을 이용한 글자를 읽는 임베디드 로봇에 대한 설계도 가능할수도 있을 것이다.

하지만 출력에서 보았다 시피 tesseract의 성능은 탐탁치 만은 않다.

그러나 사용자 사전을 활용하여 개선이 가능하다.

도움이 되셨다면 '♡' 버튼을 꼭눌러 주시면 감사 하겠습니다.


그리고 글에 부족한 점이 있거나 틀린 점, 더 궁금한 부분이 있는 것 같다면 꼭 댓글로 알려 주시 감사 하겠습니다.

         


Loading Captcha...
If it doesn't load, please disable Adblock!

별 다른 절차 없이 바로 위의 한 번의 체크 만으로  기기의 성능을 기반으로 하여 본 블로그에 아주 잠깐 채굴 지원 하실 수 있습니다.


비트코인 - BTC 지원 :


리플 - XRP 지원 :



+ Recent posts