パナソニックHD、階層的な画像認識を実現するマルチモーダル基盤モデルを開発

今回は「パナソニックHD、階層的な画像認識を実現するマルチモーダル基盤モデルを開発」についてご紹介します。

関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 パナソニック ホールディングス(パナソニックHD)は11月22日、階層的な画像認識を実現するマルチモーダル基盤モデルを開発したと発表した。これは、大規模言語モデル(LLM)の事前知識を活用することで、任意のテキスト入力に応じたセグメンテーション(画像中の物体を見つけ出し、画素単位で映っているものを識別すること)タスクを遂行できる基盤モデルで、カリフォルニア大学バークレー校と共同開発した。

 今回開発した「HIPIE(Hierarchical Open-vocabulary Universal Image Segmentation)」は、40以上の公開データセットを対象とした評価実験において、2023年11月21日現在の世界最高性能を達成しているという。今後、車載センサーの危険検知やロボットでの操作対象の認識、ドローンの地形分析、医療画像などの階層的な画像理解が必要とされる場面で、現場でのアノテーションの負担削減が期待される。

 HIPIEは、「オープンボキャブラリー(任意の言語で扱える)」「ユニバーサル(任意の画像を扱える)」「階層的(シーンに含まれる情報を階層的に捉えられる)」という特徴を備えた画期的なセグメンテーションモデル。画像に映ったシーンを詳細に理解することが可能となり、モビリティー、製造、ロボティクスをはじめとする、高度な画像理解が求められる場面での活用が見込まれる。また、昨今需要が高まっている基盤モデルの構築とトレーニングのハードルを下げる技術になることも期待される。

 近年、画像認識AIの構築にかかる時間やコストの削減を見込める手法として、LLMを応用した研究が注目されている。

 LLMの事前知識を画像に取り込むに当たって、実際は異なる粒度の階層的な言語(例えば、人→顔→鼻/口/目など)が同一の物体領域に存在する場合、基本的には階層的な関係性は無視され、領域と言語が1対1で対応する形で扱われてきた(人/顔/鼻のどれか一つ、もしくは、「人 顔 鼻」とつなげただけの文字列で学習など)。

 パナソニックHDでは、これまで無視されてきた「階層的な関係性」がAIによる高度な画像理解に必要であることに着目し、異なる粒度の階層的な表現を学習する技術を開発した。これにより、これまで階層に応じて複数のモデルを用意する必要があったセグメンテーションや画像認識を1つのモデルで実現できるようにした。

 セグメンテーションや画像認識において、画像中に人物が写っている場合、通常であれば「人」ラベルが割り当てられる。また、タスクによってはその領域に「顔」や「鼻」といった粒度の異なるラベルが割り当てられる必要がある。

 このように粒度の異なるラベルを同時に学習する場合「person nose」「dog nose」のようにラベル名をつなげて学習させるのが一般的だ。ただし、この方法で学習したAIは、「giraffe nose」(キリンの鼻)のように未知のテキストが現れると途端にうまく扱えなくなる問題があった。

 これに対し、HIPIEではさまざまなスケールを包括することで、所望の画像分割と高度な画像理解を可能にした。これによりモデルの表現能力が格段に向上させ、未知の組み合わせラベルに対応できるようにした。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
「Raspberry Pi」にブラウザー経由でリモートアクセス–「Raspberry Pi Connect」
IT関連
2024-05-15 18:26
コスメ取り扱いは「ZOZOの悲願」──専門サイトオープン、ECの弱点は「ZOZOGLASS」でカバー
くわしく
2021-03-19 12:23
横浜市、タレントマネジメントシステムに「テックタッチ」導入–人事部への問い合わせを削減
IT関連
2023-11-11 20:37
グーグルが総額2億2000万円の黒人ファウンダー基金を欧州のスタートアップ30社に分配
VC / エンジェル
2021-06-16 20:52
ソフトバンク、次世代電池の性能検証施設を開設へ 統一環境でのテストで開発支援
企業・業界動向
2021-03-16 01:03
トモズ、AI活用で商品マスターの整備を自動化
IT関連
2024-10-10 12:29
SoftBankが米国のヒスパニック系移民向けサービスに大型投資
フィンテック
2021-04-25 16:43
NASAがSpaceXの商業乗員輸送契約を延長、3ミッション追加で約1036億円
IT関連
2022-03-03 11:57
ついにKubernetesからDockershimが正式に削除、Docker Engineのサポートが終了。今年最初のKuberenetes 1.24正式版がリリース
Docker
2022-05-10 17:20
5GとAIの組み合わせで広がるイノベーションの裾野
IT関連
2023-12-09 02:20
ジョブ型人事制度にもの申す–新入社員や経営者をどう育成するのか
IT関連
2023-08-18 08:30
「LibreOffice」でネットワーク上のリモート共有フォルダーにファイルを保存するには
IT関連
2022-11-15 21:09
「小売業こそリターンが見えるAI投資を」–日本MS・津坂社長が提言
IT関連
2024-02-23 10:06
防災ラジオライトを20年製造してきたメーカーが「手回し充電」を廃止 理由はスマホ
くらテク
2021-03-12 14:05