OCRとは
OCRとは、光学文字認識 (Optical Character Recognition / Reader) の略語で、カメラやスキャナで取り込んだ画像の文字部分を認識し、コンピューターが認識できるテキストデータに変換する技術です。
手書き文字でもOCRによってテキストデータ化されるため、一旦取り込んでしまえば、後から検索をかけることによって、目的の文書にすぐにアクセスすることができます。製品としては、物理的なOCRスキャナや自前で用意した画像に対して、クラウド上でOCRを行うサービスが販売されています。
OCRの使用用途
OCRは、特に手書き文書の電子化のために用いられる場合が多く、ペーパーレス化や文書へのアクセシビリティの向上を目的として導入されています。現在は、様々な手続きがオンラインで行われますが、手書きの書類による手続きが主流のものもあります。
例えば、学校の入学願書、イベントや街頭などで行われるアンケート調査などです。紙の文書はかさばるだけでなく、目的の文書を探すのに時間がかかってしまいます。これまでは、手書きの文字を人の手で再度データ化するということが行われてきました。
しかし、OCRの導入により、スキャンするだけで検索・編集可能なデータに変換できるため、伝票や領収書などを電子化することによって、業務の効率化に大きく貢献します。
OCRの原理
OCRは画像を取り込んだ後、文字認識を行うために大きく分けて3つの処理を行っています。
- 文字が書かれている部分を抽出するために、レイアウト解析と呼ばれる処理で、文字部分とそうでない部分を大まかに分けます。
- レイアウト解析で抽出した文字列のかたまりから、列や行を決定します。
- 列や行の中から一文字一文字を切り出して、文字認識を行います。
こうして抽出された文字を同定するために、さらに3つの処理を行います。
- 文字サイズの正規化を行い、均等なサイズの文字として扱います。
- 1つの文字を線分の集合と考えて、それぞれを方向成分に分解することで文字の特徴を数値化します。
- 予め登録してあるテンプレートと比較して、パターンマッチングを行い文字を特定します。
3の工程で判断する際の指標は、ユークリッド距離の計算によって算出します。ユークリッド距離とは、人が定規で測るような二点間の距離のことで、ピタゴラスの公式 (三平方の定理) で得られる距離です。
最近では、最後のマッチングに機械学習を取り入れることによって、識字率を向上させる取り組みが盛んに行われています。
OCRソフトの種類
近年では従来型のOCR以外にも、様々な形態でOCRが提供されています。例えば、クラウドサービスとして提供されているOCRでは、ソフトのインストールが不要で、画像ファイルをクラウドサービス側に送信することによって、テキストデータを得ることができるようになりました。
また、スマートフォンアプリとして提供されているOCRでは、スマートフォンのカメラで撮影した画像をリアルタイムでテキスト化することが可能です。また、翻訳ソフトや家計簿ソフトなどにOCRが組み込まれているケースも多く、OCRでテキストを読み取ったうえで翻訳を行ったり、レシートを読み取り、自動で家計簿を作成したりできるサービスも登場しました。
これらのOCRソフトは、一定規模以下の利用であれば無料で利用できるケースも多くあり、OCRを試験的に導入することもできます。
OCRのその他情報
AIを用いたOCR
近年では、AIを用いたOCRが普及しつつあります。AIを用いたOCRはAI-OCRと呼ばれ、増えすぎた書類のデジタル化などを目的として、企業で導入されるケースも増えてきています。
従来のOCRと比較して、機械学習の手法を用いることでより高精度に文字認識ができることが特徴です。印刷された文字のように読み取りが容易な場合であれば、ほぼ100%に近い精度で読み取りが可能となります。
また、従来型のOCRでは、読み取りの前に読み取り位置や項目の定義を行う必要がありました。しかし、AI-OCRであれば、読み取り位置や読み取り項目をAIが自動で判別するため、事前の設計作業は不要です。これによって、多種多様な書類を、簡便に読み取ることができるようになりました。
最近では、RPAと呼ばれる業務の自動化ツールが普及しつつあります。RPAとはロボティックプロセスオートメーション (Robotic Process AUtomation) の略語です。AI-OCRで書類を自動読み取りしたうえで、RPAを用いて処理を自動化するような使い方が注目されています。これにより、単純作業の自動化が実現されます。
参考文献
https://mediadrive.jp/technology/techocr05.html
https://www.ricoh.co.jp/service/cloud-ocr/column/aiocr/