AIの次なる波「マルチビュー」–対象物を複数の視点から捉えて関連付ける利点と課題

今回は「AIの次なる波「マルチビュー」–対象物を複数の視点から捉えて関連付ける利点と課題」についてご紹介します。

関連ワード (CIO/経営等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 非常に大きな成功を収めている人工知能(AI)、たとえば「ChatGPT」や、タンパク質を予測するDeepMindの「AlphaFold」などは、1つの著しく狭い次元に閉じ込められてきた。すなわち、AIは物事を1つの側面からしか認識しない。1つの単語、1つの画像、空間内の1つの座標、何らかの種類のデータとして認識するが、1度に1つだけだ。

 極めて近い将来、ニューラルネットワークはデータ形式の融合によって劇的に拡大し、この世を多くの側面から見られるようになるだろう。これは重要な進展だ。というのも、世界のまとまりや物事の結びつきの仕組みに関して、ニューラルネットワークの基盤が強化される可能性があるからであり、世界を対象にいわゆる「推論」や「計画」を実行できる未来のプログラムに向けた動きが、重要な段階に入るかもしれない。

 到来しつつある多面データの波は、機械学習の科学者による長年の研究に端を発するもので、一般に「マルチビュー」またはデータフュージョンと呼ばれている。学術出版大手のElsevierは、このテーマに特化した「Information Fusion」という学術雑誌を発行しているほどだ。

 人間が調べようとする世界のあらゆるものには、多数の側面が同時に存在する。これがデータフュージョンの深遠な考え方だ。たとえば、ウェブページには、肉眼で見えるテキストと、そのページへリンクするアンカーテキストの両方がある。あるいは、3つ目の要素として、ページの構造の基礎を成すHTMLやCSSのコードも存在する。

 人間の画像には、その人物の名前のラベルと画像のピクセルの両方が含まれる場合がある。動画には、動画のフレームだけでなく、そのフレームに付随するオーディオクリップも入っている。

 現在のAIプログラムは、そうした多様なデータを世界に関する別々の情報として扱い、情報の関連付けはほとんど、あるいは全く行わない。ニューラルネットがテキストや音声といった複数の種類のデータを処理するとしても、せいぜいそれらのデータセットを同時に処理するだけだ。複数の種類のデータが同じ物事を対象としていることを理解して、それらを明示的に関連付けるわけではない。

 たとえば、Facebook、Instagram、WhatsAppを所有するMeta Propertiesは米国時間8月22日、機械翻訳における最新の取り組みを発表した。これは、複数のデータモダリティーの使用に関する偉業だ。この「SeamlessM4T」というプログラムは、音声データとテキストデータの両方で同時に訓練されており、あらゆるタスクでテキストと音声の両方を生成することができる。

 だが、SeamlessM4Tはそれぞれの信号のそれぞれの単位を同じ対象物の1つの側面と認識しているわけではない。

 そうした断片的な物の見方が変わり始めている。ニューヨーク大学の助教授兼ファカルティーフェローのRavid Shwartz-Ziv氏とMetaの主任AI科学者のYann LeCun氏は、先頃発表した論文の中で、マルチビューを使用して、対象物を複数の視点から表現することで、深層学習ニューラルネットワークを強化するという目標について論じた。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
デジタルツインのMatterportが日本法人を設立–国内の事業展開を本格化
IT関連
2022-04-16 16:13
HPE、エッジコンピューティングで宇宙探査加速目指す–「Spaceborne Computer-2」打ち上げへ
IT関連
2021-02-13 00:14
iOSアプリ開発者に訊く:LiDARで空間を演出するアプリ「Effectron」 (アフェクション)
ソフトウェア
2021-06-08 21:57
隅田川花火大会、今年も中止 「地域の方や来場者の健康が第一」
くらテク
2021-06-20 02:05
通信やメディア企業にクラウド/5Gを訴求するマイクロソフト
IT関連
2022-04-15 09:16
オンキヨー、AV事業売却 音楽デジタル化に対応できず 
IT関連
2021-05-29 00:06
東証がSREによるレジリエンス向上に挑む理由。過去のシステム障害から何を学んだのか?(前編) ソフトウェア品質シンポジウム2022
SRE
2022-09-28 13:50
ビットコイン用マイニングマシンの運用サービス、仮想通貨交換業者がスタート
最近の注目ニュース
2021-02-26 22:07
医療機器や制御システムに影響する脆弱性「NAME:WRECK」 つながるモノがはらむ危険性に警鐘 :この頃、セキュリティ界隈で(1/2 ページ)
セキュリティ
2021-04-20 04:25
フィッシングメールを正しく識別できるITリーダーは4%–シンガポール調査
IT関連
2022-03-31 10:09
iOSアプリ内でそれぞれのサブスクの管理や返金が可能に、アップルがStoreKit 2を発表
ソフトウェア
2021-06-12 23:31
Cloudflare、Workers KVの更新に失敗し障害発生。しかも復旧用ツールがWorkers KVに依存しており使えず、手動で緊急対応
Cloudflare
2023-11-07 21:30
「Android 12」、開発者プレビュー版がリリース
IT関連
2021-02-19 09:57
好きな視点と照明でリアルな合成画像 Googleなど「Neural Light Transport」開発 :Innovative Tech
イラスト・デザイン
2021-03-29 00:13