東芝、少量の画像で産業用画像領域でのAIを実現する新技術を開発
今回は「東芝、少量の画像で産業用画像領域でのAIを実現する新技術を開発」についてご紹介します。
関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
東芝は12月17日、AIの学習に必要なデータを十分に得られない産業用画像領域で、少数の実画像を用いた事前学習により高精度な解析を行う「画像解析AI」技術の開発を発表した。
産業用画像は、顕微鏡画像や赤外線画像、病理画像など、通常のカメラとは異なる特殊な装置や環境下で撮影した非自然画像を指す。収集できる枚数が少ないことから、AIに学習するためのデータが不足しがちで、倫理およびプライバシーの観点からも外部に出すことができない。このため手元の環境で解析する必要があり、さらには、試作品の開発や画像検査工程の立ち上げ時など短期間に解析効果を検証することが求められるなど事情もある。
東芝 研究開発センター 知能化システム研究所アナリティクスAIラボラトリー シニアマネジャーの武口智行氏は、「産業用画像を利用する領域では、解きたい課題のために対象画像を集めて画像解析AIの学習を行いたいと考えても少数の画像しか集められない。集めた少数の画像だけでは高精度な画像解析AIにすることができず、現場で使ってもらえないことにつながるといった悩みを抱えている人が多い」と指摘する。
そこで今回は、事前学習用の画像を大量生成するプロセスを自動的に実行することで課題の解決を図るといい、武口氏は、「この学習プロセスは利用者から見えないため、プロセスを意識することなく自動化や省人化が可能になる」と説明した。
東芝では、少数の実画像データから一部をランダムに切り出し、それを組み合わせたり、回転や反転させたりしながら学習データを自動生成、対象画像に特化した学習用画像を増やすことができるようにした。定められた手順で対象画像を基にして事前学習用画像を自動生成でき、試行錯誤する手間が不要で、ここで生成した画像データを迅速かつ高精度に解析することで、対象画像に特化した画像解析AIを開発することができるという。
「対象画像の部分的な構造をキープして特徴を維持しながら、対象画像自体とは異なる画像になるよう決められた変換で画像を生成する。本来の部分的な構造を破壊しないように、変換の前後に多段で複数回のランダムな切り出しを組み合わせ、対象画像から事前学習用画像を大量に生成する仕組みであり、対象画像と似た事前学習用画像を大量に集める手間も不要になる」(武口氏)という。
一般的に、高精度な画像解析の実現には、数万枚以上の大量の実画像データが必要とされる。今回は、独自の事前学習方式により最小40枚という少数の実画像データで迅速、高精度な解析を実現。学習データ収集とデータ作成に時間とコストが要するという課題も解消できる。
実証では、インターネット上に公開されている赤外線画像、顕微鏡画像、ウェハー画像、病理画像、眼底画像の5種類の非自然画像データセットから、それぞれランダムに40~1000枚の少量の実画像データを選択。学習データ画像の枚数を数十倍から数百倍になるまで自動生成し、9000~3万枚の事前学習用画像を用意。これを用いて事前学習を行い、画像識別タスク評価を行った。データの画素数は、赤外線画像では250×190ピクセル、ウェハー画像では45×45ピクセルとさまざまだ。
武口氏によると、少数の対象画像を与えた際に、事前学習なしでは65%の識別率だったものの、今回の技術では平均で88%の識別率を達成した。赤外線画像では99%の識別率を達成している。また、難易度の高い眼底画像は、事前学習なしでは31%の識別率だったが、今回の技術では57%の識別率と2倍近くまで上昇しているとする。また、「ImageNet」における130万枚の大規模自然画像データを用いた事前学習によるAIの識別率の精度を上回る水準となり、対象画像を識別できたという。
これにより、これまで画像解析AIの活用が難しかった産業分野での適用が可能になり、解析の自動化による効率化や省人化に貢献できるとしている。少ない計算リソースでのAI構築も可能になり、短期間に高性能なAIモデルの構築を実現できるとした。