Metaの自己教師あり学習AI「data2vec」がバージョン2.0に–学習速度が向上

今回は「Metaの自己教師あり学習AI「data2vec」がバージョン2.0に–学習速度が向上」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 「Facebook」「Instagram」「WhatsApp」を所有するMetaが米国時間12月13日、2022年1月に発表した自己教師あり学習アルゴリズム「data2vec」の改良版「data2vec 2.0」を発表した。ジェネラリストのように機能して、テキスト、画像、および音声データを含むタスクに対して、基本的にすべて同じアプローチで取り組むというものだ。

 data2vec 2.0で、Metaの科学者らはプログラムを高速化した。さらに複数の事例では、機械学習タスクのベンチマークテストでより高い精度を記録している。

 初代data2vecに関する論文の執筆者に含まれるAlexei Baevski氏とArun Babu氏、Wei-Ning Hsu氏、Michael Auli氏は、「arXiv」に投稿した新たな論文「Efficient Self-supervised Learning with Contextualized Target Representations for Vision, Speech and Language」の中で、「data2vec 2.0は、下流のタスクの精度を損なうことなく、自己教師あり学習の訓練速度を大幅に改善できることを示している」と述べた。

 data2vec 2.0の目覚ましい成果は、訓練にかかる時間を短縮したことだ。ニューラルネットワークの訓練は通常、「エポック」という単位で測定される。エポックは、ニューラルネットワークに訓練用サンプルが与えられる回数を意味する。ニューラルネットワークの訓練は、開始から終了までの実時間でも測定される。

 「実験では、data2vec 2.0が2倍~16倍の訓練速度で、多くの一般的な既存アルゴリズムと同じ精度に到達できることが明らかになっている」(同論文)

 data2vecという名称は、Googleによって2013年に開発された「単語の埋め込み」プログラム「word2vec」をもじったものとみられる。word2vecは、特定の種類のデータ(この場合はテキスト)向けに設計されたニューラルネットワークだ。

 一方、data2vecでは、Baevski氏らはGoogleのAshish Vaswani氏らが2017年に開発したニューラルネットワーク「Transformer」を採用し、複数の種類のデータに使えるよう拡張している。このニューラルネットワークでは、同じ構造で、画像、音声、テキストのすべてを訓練できる。データの種類に合わせて変更する必要がないので、ジェネラリストプログラムと言える。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
SAP、福井大学など産学官民連携で地域課題解決への取り組みを開始
IT関連
2021-05-12 01:02
Google、開発者向けの無料プログラム「Google Developer Program」開始。WebIDE「Project IDX」のワークスペースを5つまでなど特典が提供
Google
2024-06-05 10:40
オーストリアのBitpandaが取引プラットフォームを暗号通貨以外にも拡大、約185億円調達し評価額約1310億円に」
フィンテック
2021-05-18 04:42
ムーンショット型研究開発制度として本格始動、量子コンピューターへの期待
IT関連
2021-01-29 20:43
パートナーも含めた「四方よし」を目指す–日本オラクルがSaaS事業戦略
IT関連
2021-08-06 22:18
マイクロソフト、Android版「Edge」向けに拡張機能ストアを提供
IT関連
2025-03-19 07:58
イオンとナガセが語る、生成AIで開発した新サービス–マイクロソフト顧客事例
IT関連
2024-06-27 16:48
新しい「Outlook for Windows」プレビュー版がリリース–Outlookの統合に向け
IT関連
2022-09-30 22:23
デル、法人向けPC 「OptiPlex 5000タワー/スモールフォームファクター/マイクロ」発売
IT関連
2022-03-10 14:24
ノースロップ・グラマンが軌道上の古い衛星の再生に成功、衛星の寿命を5年延ばす
宇宙
2021-04-18 17:08
ネオジャパン、避難確保計画の作成システムを構築–年間の作業時間が41%減少
IT関連
2023-04-29 05:30
サイバー攻撃による「深刻な被害」をゼロに–サイバーセキュリティ連盟
IT関連
2023-03-28 03:19
前田建設工業、IoT基盤で現場データのリアルタイム管理を実現
IT関連
2023-05-04 20:51
多様化するボット–「遮断」ではなく「管理」で講じる対策
IT関連
2022-03-24 00:56