東芝情報システム、AIの学習に必要な教師データを短期間で大量作成するサービスを提供
今回は「東芝情報システム、AIの学習に必要な教師データを短期間で大量作成するサービスを提供」についてご紹介します。
関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
東芝情報システムは、人工知能(AI)の学習に必要な教師データを自動作成する「自動アノテーションサービス」の提供を開始した。同サービスは、ユーザーの教師仕様に基づいた教師例と教師対象データを預かり、高精度な教師データを自動作成し、短期間で提供する。なお手作業による教師データ作成の中でも特に時間を要する、画像のセマンティックセグメンテーションを対象としている。
同サービスでは、東芝情報システムが独自に開発した自動アノテーションプラットフォームを活用することににより、画像のセグメンテーション手法を複数組み合わせ、高精度な教師データを作成することができる。このプラットフォームは自動アノテーションに必要となる事前学習を行っており、ユーザーから預かった少量の教師例を追加学習させることで、ユーザーの仕様に合わせた高精度な教師データを自動作成する。
また18クラスを認識する自動運転向け教師データ作成のベンチマークでは、自動アノテーションプラットフォームに、ユーザーから預かる教師例とみなした5000枚を追加学習させ、教師データを自動作成したところ、精度(mIoU) 84.7% という高精度を実現した。
認識対象の18クラスは、乗用車、トラック、バイクや自転車、車道、歩行者、空、車線、歩道、縁石、ガードレール、道路標識、植生、電柱、建物、障害物、駐車場、自車、その他(認識対象では無い物)。ベンチマークでは、遠方の車種、重なり合った物体、植生の複雑な境界などを、高い精度で認識、識別できた。
さらなる精度の改善にも「自動アノテーションサービス」で作成する教師データを活用することで、手作業の修正量を大きく削減することができる。
また今回行ったベンチマークでは、1日(24時間)で9600枚の教師データが作成可能だった。これを手作業で作成した場合は、1日(8時間)で16枚の教師データしか作成できないことから、99%以上の作成時間削減を実現したことになるという。