パナソニックHD、階層的な画像認識を実現するマルチモーダル基盤モデルを開発

今回は「パナソニックHD、階層的な画像認識を実現するマルチモーダル基盤モデルを開発」についてご紹介します。

関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 パナソニック ホールディングス(パナソニックHD)は11月22日、階層的な画像認識を実現するマルチモーダル基盤モデルを開発したと発表した。これは、大規模言語モデル(LLM)の事前知識を活用することで、任意のテキスト入力に応じたセグメンテーション(画像中の物体を見つけ出し、画素単位で映っているものを識別すること)タスクを遂行できる基盤モデルで、カリフォルニア大学バークレー校と共同開発した。

 今回開発した「HIPIE(Hierarchical Open-vocabulary Universal Image Segmentation)」は、40以上の公開データセットを対象とした評価実験において、2023年11月21日現在の世界最高性能を達成しているという。今後、車載センサーの危険検知やロボットでの操作対象の認識、ドローンの地形分析、医療画像などの階層的な画像理解が必要とされる場面で、現場でのアノテーションの負担削減が期待される。

 HIPIEは、「オープンボキャブラリー(任意の言語で扱える)」「ユニバーサル(任意の画像を扱える)」「階層的(シーンに含まれる情報を階層的に捉えられる)」という特徴を備えた画期的なセグメンテーションモデル。画像に映ったシーンを詳細に理解することが可能となり、モビリティー、製造、ロボティクスをはじめとする、高度な画像理解が求められる場面での活用が見込まれる。また、昨今需要が高まっている基盤モデルの構築とトレーニングのハードルを下げる技術になることも期待される。

 近年、画像認識AIの構築にかかる時間やコストの削減を見込める手法として、LLMを応用した研究が注目されている。

 LLMの事前知識を画像に取り込むに当たって、実際は異なる粒度の階層的な言語(例えば、人→顔→鼻/口/目など)が同一の物体領域に存在する場合、基本的には階層的な関係性は無視され、領域と言語が1対1で対応する形で扱われてきた(人/顔/鼻のどれか一つ、もしくは、「人 顔 鼻」とつなげただけの文字列で学習など)。

 パナソニックHDでは、これまで無視されてきた「階層的な関係性」がAIによる高度な画像理解に必要であることに着目し、異なる粒度の階層的な表現を学習する技術を開発した。これにより、これまで階層に応じて複数のモデルを用意する必要があったセグメンテーションや画像認識を1つのモデルで実現できるようにした。

 セグメンテーションや画像認識において、画像中に人物が写っている場合、通常であれば「人」ラベルが割り当てられる。また、タスクによってはその領域に「顔」や「鼻」といった粒度の異なるラベルが割り当てられる必要がある。

 このように粒度の異なるラベルを同時に学習する場合「person nose」「dog nose」のようにラベル名をつなげて学習させるのが一般的だ。ただし、この方法で学習したAIは、「giraffe nose」(キリンの鼻)のように未知のテキストが現れると途端にうまく扱えなくなる問題があった。

 これに対し、HIPIEではさまざまなスケールを包括することで、所望の画像分割と高度な画像理解を可能にした。これによりモデルの表現能力が格段に向上させ、未知の組み合わせラベルに対応できるようにした。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
マイクロソフト、米政府の機密データ対応「Azure Government Top Secret」をGAに
IT関連
2021-08-17 18:33
胡蝶しのぶの「日輪刀」、バンダイが発売 セリフや効果音を収録 刀身の蝶が光る
くらテク
2021-02-25 18:22
ヤマダウェブ、Apple製品をApple Pay購入でポイント10%付与実施中
IT関連
2021-08-14 11:39
カスペルスキー、アジアでのスパイ攻撃「TetrisPhantom」を報告–ワーム流行も注視
IT関連
2023-11-14 22:02
デル、「Intel Core Ultra」搭載の「XPS」ノートPC新モデルを発表
IT関連
2024-01-06 12:28
第3回:オブザーバビリティを組織変革のドライバーに
IT関連
2023-12-20 14:26
アズワン、自社ECにウェブ接客ツールを導入–問い合わせやクレームが30〜35%減少
IT関連
2022-08-19 04:38
ゲリラ豪雨、今年は7.5万回の予想 北海道は去年の倍か
くらテク
2021-07-15 13:31
RedisとKafkaのためのサーバーレスデータプラットフォーム構築のためにUpstashが約2.3億円のシード資金獲得
IT関連
2022-03-20 11:05
マイクロソフト、「Project Reunion 0.5」をリリース
IT関連
2021-03-31 14:45
WebAssemblyアプリ開発で最も使われている言語はRust、注目の機能はスレッドなど。The State of WebAssembly 2021
WebAssembly
2021-07-01 05:44
キンドリル、日本向けにセキュリティやコンプライアンスの新機能
IT関連
2024-04-16 07:02
MicrosoftとOSSの親和性、Azureインフラ強化の取り組みは?
IT関連
2021-04-27 17:12
Cohesity、ベリタスからデータ保護事業を買収–ベリタスは新会社に
IT関連
2024-02-14 15:55