画像解析

画像解析とは

画像解析

画像解析とは、コンピューターが画像内の属性を認識する能力です。つまり取得した画像からデジタルなデータの特徴を取り出して、人間の主観的な判断や人間の判断基準をもとにアルゴリズムを作成し、自動的に判断することを指します。

例えば画像解析の技術は、わたしたちの生活においてスマートフォンの写真アプリで普及しています。写真アプリで使われる技術は、顔の認識機能を利用して写真に映っている対象を分類することで、類似した対象を一覧として表示することに使用されています。

私たちは、ソーシャルメディアも利用していますが、ソーシャルメディアでは、テキスト分析が基本機能として利用されています。また、ソーシャルメディアにおいて画像解析の重要性は高まっています。

なぜなら、ソーシャルメディアの分析という観点において、画像解析は、テキスト分析の機能をビジュアルコンテンツに適用した延長線上のものとして考えられているからです。

1960年代後半のAIの出現から機械学習をはじめとする人工知能が発達してきました。現代では、この技術を利用して画像と付与情報から情報を抽出することにより自動的に判断が行えるようになっています。

画像解析の導入

画像解析の導入例を挙げると、染色体異常試験法の開発が挙げられます。

染色体異常試験法とは、発がんの初期過程を予測するために培養細胞を用いて化学物質による染色体の構造異常や数的異常の誘発性を調べる試験方法です。

自然水や飲料水のなかに含まれる変異原物質や発がん物質を検出するためには、微生物を用いたスクリーニングテストが行われることが多いです。しかし、人に対する危険性を定量的に評価するためには、哺乳動物を試験対象とすることが望まれています。

よって、簡単な試験方法として哺乳動物の培養細胞を活用することで、安全性も考慮することが可能になります。

さらに、哺乳動物の培養細胞を用いた染色体異常試験を取り入れていく意義が大きいため、染色体増を画像解析することによって異常の検出と試験結果への客観性をもたせる研究に利用されています。

一方で、画像解析の技術は、高度な発達を遂げていますが、使いこなすための解析手法が追いついていません。

そのため、この研究は、画像解析の手法を押し上げるためにも極めて重要になります。

この研究は「衛生工学研究論文集、第26巻、1990(Proc. of Environ. & Sani. Eng. Research,Vol.26,1990)」に記載されています。

画像解析のメリットとデメリット

画像解析のメリットとしては、生産性の向上や労働環境の改善、人件費の削減につながることが挙げられます。例えば画像解析を検品作業に組み込んだ場合には、人の目を使用せずに部品などの不良を判別できます。

また、画像解析に加えて仕分け機械やロボットを連動させることにより、自動で検品対象を振り分けることも可能となります。

そのため、長時間の作業や危険が伴う環境でも検品作業が可能になり、職場の安全にもつながります。

さらに、ヒューマンエラーによる品質のブレを減少し、人の目で見逃した品質不良を後々にダブルチェックするなどの無駄な労力を削減できるため、別の業務を行う余裕が生まれ、人件費の削減にもつながります。

一方で、画像解析のデメリットには、画像解析を行うための設備費用が生じる点やソフトウェア・アプリケーションの少なさが挙げられます。

画像解析を行うには、カメラやセンサー、モニターなどが必要となり、初期費用が高くなります。また、画像解析は、まだまだ発展途上の技術のため、業務に適したソフトウェアやアプリケーションを見つけることが難しいかもしれません。

ただし、今後も発展していくと考えられる分野のため、ニーズに適した商品が販売されているか注視することも必要になります。

画像解析の手法と種類について

画像解析の代表的な手法には、画像分類と物体検出、画像セグメンテーションの3つの区分があります。

  • 画像分類(Image Classification)

    画像分類とは、対象の画像のなかに何があるのかを区別し、カテゴリーで分ける方法を指します。画像や写真には、異なる情報が保持されており、これらの情報をラスター画像から特徴を抽出することで画像を分類します。例えば1枚の画像のなかにある空間をそれぞれイヌ・ネコ・ヒト・空・木などのように機械へ覚えさせることで認識させます。

  • 物体検出(Object Detection)

    物体検出は、画像分類と同様の動作により、対象物が何なのかを検出する方法です。しかし、物体検出は、これに加えて物体の領域の位置を絞り込み、認識している対象以外をはじく動作を行います。また、画像分類は、画像のなかの1つを対象とするのに対して、物体検出では、複数の対象をとらえることができます。

  • 画像セグメンテーション(Image segmentation)

    画像セグメンテーションとは、画像の領域が何なのかを判別する方法です。この方法は、一般的に複数の技術を組み合わせて動作させています。例えば判別した領域の信頼性を確実なものとするためには、アノテーションと呼ばれるタグ付け作業が必要になります。アノテーションは、特定の情報にメタデータを付与することで、対象に情報タグを付けて判別する方法です。

また、画像解析の技術には、以下の2種類があります。

  • 顔認識

    顔認識は、コンピューターが、その人の顔の特徴を抽出し、識別するための技術です。データベース上に登録されている顔の情報とセンサーで検出している顔の情報を比較する場合は、顔認証という技術が使われます。近年では、ヒトの顔だけではなく、動物の顔も検出できるようになっています。また、顔の表情を読み取る技術は、感情認識と呼び、研究が進められています。

  • 文字認識

    文字認識は、紙を媒体とした文書に記載されている文字を読み取り判別する技術です。一般的には、スキャナーを使用して文字を読み取ったり、カメラで撮影して文字を読み取ったりすることで文字データとして取り込んでいます。取り込まれた文字データは、テキストデータに変換され、翻訳機能や文字の差分チェックなどに活用されます。

AIと画像解析の関係

AIは、人工知能と呼ばれており、人間の脳の仕組みを模範し、コンピューターが人間のような知的活動を行う仕組みです。こうした仕組みと画像解析を組み合わせることで、より確実性をもたせることができます。

AIを活用した画像解析は、ニーズに合わせてさまざまな種類が普及を始めています。このトピックでは、一般的な画像認識の方法を解説し、どのように活用されているのかを解説します。

まず、AIを使用するためには、画像のデータを準備し、検出したい対象が何なのかを覚えさせなければなりません。なぜなら、AIによる画像解析は、対象の判別ができなければ、そこに何かがあるということしか判断できないからです。

そして、対象の特徴を学習させる画像の枚数は、多いに越したことはありませんが、画像の枚数が少ない場合には、画像を拡大・縮小・回転させることで画像の枚数を増やすことが可能です。

また、学習する特徴は、複数指定することでより正確性が増します。例えば耳だけを特徴として学習した場合は、耳がある対象を検出しますが、それが何の耳なのかの判断ができません。

その後、畳み込みと呼ばれる方法で検出率を判断します。畳み込みは、画像をいくつかの四角形で区分し、その枠内の一致率が特徴と比べてどれだけの正確性を有しているかを数値で判断します。

特徴を学習した後は、プーリングと呼ばれる手法で、畳み込みのなかから1番数値が高いものを選択し、特徴を要約します。

最後に特徴の検出率と一致率を判断し、性能を評価します。ここで良い結果が得られない場合には、上記で解説した方法をアップデートしていきます。

画像解析の活用

画像解析は、例としてガボールウェーブレット変換を用いたコンクリートのひび割れに対する画像解析技術を開発する手段として活用されています。

ガボールウェーブレット変換とは、データを解析するための数学的なツールです。

コンクリート構造物のひび割れ調査は、目視観察による点検調査で行われています。

しかし、この調査方法では、点検者によって評価のばらつきが生じてしまい、見落としによる客観性や定量性に影響を及ぼします。そのため、点検調査の効率化や自動化、デジタル性が必要とされ、デジタル画像処理による研究が行われました。

この画像処理における手法を確立するためには、精度の高いひび割れ検出方法や処理作業が必要不可欠になります。

したがって、これらを実現するために既存の二次元ガボールウェーブレット変換を活用した画像解析手法に改良を加えることで、実構造物のひび割れに対して有効性が確認されました。

この研究は「土木学会論文集E2(材料・コンクリート構造), Vol.68, No.3,178-194,2012.178」に記載されています。

また、画像解析は、このほかにも粒子解析にも利用されており、セラミックや樹脂、金属といった材料の「粒子の数」「粒子の直径」「周囲長の分布」「粒子の破損」の測定に活用されています。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です