AIOCRとは
AIOCRとは、OCR (英: Optical Character Reader) 技術にAI (英: Artificial Intelligence) を組み合わせたものです。
OCRは、手書きやプリントされた文字をスキャナやデジカメで読み取りテキストデータに変換する技術です。この従来のOCRの技術にAIの技術を活用し、融合させた新しいOCR処理技術がAIOCRと呼ばれています。
AI OCRはAI (人工知能) の中でも、特にディープラーニング (英: Deep Learning) と呼ばれる深層学習の機能を取り入れ、文字の特徴やパターンを学習し、文字の認識精度や文字範囲やレイアウトの解析精度を向上させることが可能となりました。また、これまで困難であった罫線や取り消し線、文字の癖などの読み取りができるようになりました。
AIOCRの使用用途
AIOCRでは、従来のOCRが苦手としていた手書き文字や複数のレイアウトが混在した帳票、より精度の高い文字認識を必要とする業務で使用されています。
1. 手書き文字を扱う場合
手書きの伝票やアンケート、問診表、申込書、作業日報など手書きの書類を扱うことが多い業務で使われます。
2. レイアウトが複数混在している場合
中小企業の現場に多いFAXで届く各社からの注文書や請求書などレイアウトが統一できない業務に適しています。
3. 文字認識の精度を上げたい場合
大量のドキュメントを読み込んでデジタル化する現場では読み取り精度が1%違っても修正工数が大きく変わります。AIによる学習により認識精度が向上し工数削減になります。
AIOCRの原理
AIOCRは、深層学習方式で文字を認識しています。手書きによる文字認識の原理は、例えば「犬」をディープラーニングで学習したAIが、犬の画像を見て、それが犬であると認識できるのと同じです。犬の画像を犬と認識するのは、数多くの犬の画像を学習させることで、特徴を抽出・分類した結果を使って推定しています。
それと同様に、手書き文字を認識する場合も、手書き文字の画像を大量に学習させることで、特徴を抽出・分類していきます。その結果、AIが手書き文字の内容を自動的に判断し、読み取る精度を高めていくことが可能になります。つまり、非定型の文字データであっても、手書きの文字メモであっても、取引先ごとに異なる伝票などであっても、項目を判断してデータ化が可能です。
深層学習方式の課題は、各処理の組み合わせをするために学習データが大量に必要になることが挙げられます。また、大量のデータを処理するために、高性能な演算装置 (GPU等) が必要となる場合もあります。
AIOCRの選び方
AIOCRの製品を選ぶ際は、以下のポイントに注意します。
1. 対象原稿の文字種類
読み取る原稿内に使われている文字が手書きなのか、印字された文字なのか、あるいは混在なのかで対応できる製品が違ってきます。それぞれに向き不向きがあり、間違った製品を選択すると文字認識の精度が低くなってしまいます。
2. 対象帳票のフォーマット
読み込みを行う対象帳票のフォーマットが限定されているのか、限定されていないかにより変わってきます。フォーマットが限定されている場合は事前にフォーマットの定義を行うタイプの方が読み取り精度が高くなります。
反対にフォーマットが限定されていない場合は帳票のフォーマットをAIに学習させて抽出するタイプが適しています。
3. 他システムとの連携
紙媒体に記載されている文字をAIOCRで読み取ってテキストデータにして完了ではなく、他の業務システムへの入力データとなることが多いです。自社で連携が必要な業務システムと問題なく接続できるかを確認します。また、最近普及してきているRPAとの親和性も確認ポイントの1つです。
4. コストパフォーマンス
AIOCRの料金体系はさまざまです。月額固定やページ当たりの従量課金などがあります。自社の使用シーンや規模感を考えて有利なサービスを選択します。
5. 操作性
AIOCRを実際に利用するのはシステム部門のユーザではなく、経理や人事、マーケティングなどです。AIOCRを活用してもらうためにも、業務にあった操作性に優れたシステムを導入するのがポイントです。
6. 実績
実績の確認も大事なポイントです。可能であれば、自社の業務と類似の事例がある製品を選ぶと良いです。