OCR이란?
OCR은 광학 문자 인식(Optical Character Recognition / Reader)의 약자로, 카메라나 스캐너로 촬영한 이미지의 문자 부분을 인식하여 컴퓨터가 인식할 수 있는 텍스트 데이터로 변환하는 기술입니다.
손글씨도 OCR을 통해 텍스트 데이터로 변환되기 때문에, 한번 입력하면 나중에 검색을 통해 원하는 문서에 바로 접근할 수 있습니다. 제품으로는 물리적인 OCR 스캐너나 자체적으로 준비한 이미지에 대해 클라우드 상에서 OCR을 수행하는 서비스가 판매되고 있습니다.
OCR의 사용 용도
OCR은 특히 수기 문서의 전자화를 위해 사용되는 경우가 많으며, 페이퍼리스화 및 문서 접근성 향상을 목적으로 도입되고 있습니다. 현재 다양한 절차가 온라인으로 이루어지고 있지만, 여전히 수기로 작성하는 서류가 주류인 경우도 있습니다.
예를 들어, 학교의 입학원서, 행사나 길거리에서 진행되는 설문 조사 등이 있습니다. 종이 문서는 부피가 클 뿐만 아니라 원하는 문서를 찾는 데 시간이 오래 걸립니다. 지금까지는 손으로 쓴 글자를 사람의 손으로 다시 데이터화하는 작업을 해왔습니다.
하지만 OCR 도입으로 스캔만 하면 검색 및 편집이 가능한 데이터로 변환할 수 있기 때문에 전표나 영수증 등을 전자화함으로써 업무 효율화에 크게 기여할 수 있습니다.
OCR의 원리
OCR은 이미지를 가져온 후 문자 인식을 위해 크게 세 가지 과정을 거칩니다.
1. 문자가 쓰여진 부분을 추출하기 위해 레이아웃 분석이라는 처리로 문자 부분과 그렇지 않은 부분을 크게 나눕니다.
2. 레이아웃 분석으로 추출한 문자열 덩어리에서 열과 행을 결정합니다.
3. 열과 행을 한 글자 한 글자씩 잘라내어 문자 인식을 수행합니다.
이렇게 추출된 문자를 식별하기 위해 세 가지 처리를 더 진행합니다.
1. 문자 크기 정규화를 수행하여 균일한 크기의 문자로 취급합니다.
2. 하나의 문자를 선분의 집합으로 간주하고, 각각을 방향 성분으로 분해하여 문자의 특징을 수치화합니다.
3. 미리 등록된 템플릿과 비교하여 패턴 매칭을 통해 문자를 식별합니다.
3의 과정에서 판단하는 지표는 유클리드 거리 계산을 통해 산출합니다. 유클리드 거리란 사람이 자로 잴 수 있는 두 점 사이의 거리를 말하며, 피타고라스의 공식(삼각형의 정리)으로 구할 수 있는 거리입니다.
최근에는 마지막 매칭에 머신러닝을 도입해 문맹률을 높이기 위한 노력이 활발히 이루어지고 있습니다.
OCR 소프트웨어의 종류
최근에는 기존의 OCR 외에도 다양한 형태로 OCR이 제공되고 있습니다. 예를 들어, 클라우드 서비스로 제공되는 OCR은 별도의 소프트웨어 설치가 필요 없이 이미지 파일을 클라우드 서비스 측에 전송하여 텍스트 데이터를 얻을 수 있게 되었습니다.
또한 스마트폰 앱으로 제공되는 OCR은 스마트폰 카메라로 촬영한 이미지를 실시간으로 텍스트화할 수 있습니다. 또한 번역 소프트웨어나 가계부 소프트웨어 등에 OCR이 내장되어 있는 경우도 많아 OCR로 텍스트를 읽은 후 번역을 하거나, 영수증을 읽고 자동으로 가계부를 작성하는 서비스도 등장했습니다.
이러한 OCR 소프트웨어는 일정 규모 이하의 이용이라면 무료로 이용할 수 있는 경우도 많아 OCR을 시범적으로 도입해 볼 수도 있습니다.
OCR에 대한 기타 정보
AI를 이용한 OCR
최근에는 AI를 이용한 OCR이 보급되고 있는데, AI를 이용한 OCR은 AI-OCR이라고 불리며, 늘어나는 서류의 디지털화 등을 목적으로 기업에서 도입하는 사례가 늘고 있습니다.
기존 OCR에 비해 머신러닝 기법을 활용해 보다 높은 정확도로 문자를 인식할 수 있는 것이 특징입니다. 인쇄된 문자처럼 판독이 용이한 경우라면 거의 100%에 가까운 정확도로 판독이 가능합니다.
또한, 기존 OCR은 판독 전에 판독 위치나 항목을 정의해야 하는 번거로움이 있었습니다. 하지만 AI-OCR은 판독 위치와 판독 항목을 AI가 자동으로 판단하기 때문에 사전 설계 작업이 필요 없습니다. 이를 통해 다양한 종류의 서류를 간편하게 판독할 수 있게 되었습니다.
최근에는 RPA라는 업무 자동화 도구가 보급되고 있는데, RPA는 로보틱 프로세스 자동화(Robotic Process AUtomation)의 약자로, AI-OCR로 문서를 자동 판독한 후 RPA를 활용해 처리를 자동화하는 사용하는 방법이 주목받고 있습니다. 이를 통해 단순 업무의 자동화를 실현할 수 있습니다.