Metaの自己教師あり学習AI「data2vec」がバージョン2.0に–学習速度が向上

今回は「Metaの自己教師あり学習AI「data2vec」がバージョン2.0に–学習速度が向上」についてご紹介します。

関連ワード (ソフトウェア等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 「Facebook」「Instagram」「WhatsApp」を所有するMetaが米国時間12月13日、2022年1月に発表した自己教師あり学習アルゴリズム「data2vec」の改良版「data2vec 2.0」を発表した。ジェネラリストのように機能して、テキスト、画像、および音声データを含むタスクに対して、基本的にすべて同じアプローチで取り組むというものだ。

 data2vec 2.0で、Metaの科学者らはプログラムを高速化した。さらに複数の事例では、機械学習タスクのベンチマークテストでより高い精度を記録している。

 初代data2vecに関する論文の執筆者に含まれるAlexei Baevski氏とArun Babu氏、Wei-Ning Hsu氏、Michael Auli氏は、「arXiv」に投稿した新たな論文「Efficient Self-supervised Learning with Contextualized Target Representations for Vision, Speech and Language」の中で、「data2vec 2.0は、下流のタスクの精度を損なうことなく、自己教師あり学習の訓練速度を大幅に改善できることを示している」と述べた。

 data2vec 2.0の目覚ましい成果は、訓練にかかる時間を短縮したことだ。ニューラルネットワークの訓練は通常、「エポック」という単位で測定される。エポックは、ニューラルネットワークに訓練用サンプルが与えられる回数を意味する。ニューラルネットワークの訓練は、開始から終了までの実時間でも測定される。

 「実験では、data2vec 2.0が2倍~16倍の訓練速度で、多くの一般的な既存アルゴリズムと同じ精度に到達できることが明らかになっている」(同論文)

 data2vecという名称は、Googleによって2013年に開発された「単語の埋め込み」プログラム「word2vec」をもじったものとみられる。word2vecは、特定の種類のデータ(この場合はテキスト)向けに設計されたニューラルネットワークだ。

 一方、data2vecでは、Baevski氏らはGoogleのAshish Vaswani氏らが2017年に開発したニューラルネットワーク「Transformer」を採用し、複数の種類のデータに使えるよう拡張している。このニューラルネットワークでは、同じ構造で、画像、音声、テキストのすべてを訓練できる。データの種類に合わせて変更する必要がないので、ジェネラリストプログラムと言える。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
企業の約4割がIT予算の多くをAIに投資、「成果なし」も約4割–シスコ調査
IT関連
2024-11-27 19:32
Ruby30周年イベント(後編):まつもと氏「Static Compiler for Ruby」を作りたい。道具立ては揃ってきた
Ruby
2023-03-03 08:33
WDS 、東芝デジタルソリューションズのIoT基盤活用でCO₂の濃度監視サービス提供
IT関連
2021-05-26 02:38
劇場版「機動戦士ガンダム00」、8日からYouTubeで無料配信 ガンダムチャンネル登録105万人突破で
くらテク
2021-05-09 12:44
千葉工業大学の宇宙塵探査衛星ASTARISC、大面積膜型ダストセンサーを展開し軌道上実証に成功
IT関連
2022-02-18 12:35
変わりたい中堅・中小企業にこそマルチクラウドのススメ–ウェビナー開催
IT関連
2022-08-19 01:33
社員のワクチン接種や副反応を自社のノーコードアプリで管理 アステリア
DX
2021-06-08 01:13
現場監督の業務を効率化する建設現場管理・図面共有アプリ「SPIDERPLUS」が4万ユーザーを突破
ソフトウェア
2021-05-14 12:56
企業は増え続けるサイバー脅威への備えが必要–CISA元長官
IT関連
2022-08-17 03:12
テスト自動化クラウドサービス「Autify」、iOSネイティブアプリに対応 実機は不要
クラウドユーザー
2021-01-30 01:01
経営者と従業員の双方で不安を解消–仮想オフィス「Sococo」活用の実際
IT関連
2021-02-28 04:17
WBS、出演者がマスク着用 テレビスタジオ内での染防止策を強化
くらテク
2021-01-21 07:52
マイクロソフト、2月7日にイベント開催へ–「ChatGPT」と「Bing」関連か
IT関連
2023-02-08 08:56
Cloudflare、NGINXに代えて自社開発のRust製HTTPプロキシ「Pingora」をグローバルCDNに採用。性能向上しつつCPUとメモリ消費を3分の1に
Cloudflare
2022-09-22 17:35