본문 바로가기

IT/컴퓨터IT

이미지 텍스트 변환하여 그림파일에서 글자 추출하는 방법

 해외여행을 가서 간판이나 무슨 글씨인가 하고 폰으로 사진을 찍어놨다가 집에 와서 포스팅을 쓰려고 하면 그 글씨가 무슨 뜻인지 그 간판은 어떤 이름인지 알지 못하여 난감한 경우가 있습니다. 이런 경우 보고 쓰면 된다고 생각이 들지 모르지만 영어로는 어떻게든 쓸 수 있지만 다른 나라의 언어(가까운 나라는 중국이나 일본) 같은 외국어로 쓰여 있는 경우에는 글씨도 모르거니와 키보드에 있는 자판의 위치도 모르기 때문에 쓰기는커녕 번역이나 읽기도 안되기 때문에 찾을 수가 없습니다. 이렇게 난감한 경우 구글 드라이브의 Optical character recognition(OCR) 기능을 활용해서 이미지 파일에서 텍스트를 인식하게 하는 기능이 있는데 오늘은 이 기능에 대해서 소개해보겠습니다.

 

 

 이미지에서 텍스트 추출하기 


 

 

▲ 인터넷 창에서 구글을 켭니다. 오른쪽 위에 보면 네모 9개가 있는데 그것을 누르면 구글 메뉴가 나올 것입니다. 여기서 구글이 로그인 되어 있지 않다면 로그인을 해야 네모 9개가 보입니다.

 

 

▲ 오늘 진행할 샘플입니다. 사진은 구글맵에 한자와 한글이 둘 다 인식되는지 확인하기 위해서 구글맵에 나오는 글자를 활용해보겠습니다.

 

 

▲ 내 컴퓨터에 저장되어 있는 구글맵 사진을 구글 드라이브로 끌어서 넣기를 해서 복사해줍니다. 신기한 것이 구글 드라이브에 그냥 끌어넣었는데 복사가 되는 것이었습니다.(저만 신기한 가요?)

 

 

내 드라이브에 끓어 넣기로 사진이 저장되었다면 사진에 마우스 포인터를 갖다 대고 오른쪽 버튼을 클릭하여 연결 앱 - Google 문서를 클릭해서 실행합니다.

 

 

▲ 약간의 로딩 시간이 지난 후에 사진에 있는 글씨들이 텍스트화되는 것을 볼 수 있을 것입니다.

 

 

▲ 정말 신기하게 로딩이 끝난 후에 이미지에 있는 중국어와 한글이 대부분 텍스트로 추출되어 변환된 것을 확인할 수 있었습니다.

 

 

▲ 그래서 이참에 몇 년 전에 일본에 갔다가 궁금해서 찍어둔 사진에서 텍스트로 변환해봤습니다. 눈으로 확인되는 글자들은 얼추 텍스트로 변환되는 것을 볼 수 있을 것입니다. 이외에도 텍스트를 이미지화 시킨 PDF 파일을 글씨로 바꾸는 작업도 가능하며 문서로 된 이미지 파일일수록 추출의 정확도가 높아집니다.