DeepSeek「R1」の精度に迫る、グーグルの「Gemma 3」–処理能力と効率性を両立

今回は「DeepSeek「R1」の精度に迫る、グーグルの「Gemma 3」–処理能力と効率性を両立」についてご紹介します。

関連ワード (データマネジメント等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 AIの経済学が話題になる中、DeepSeekはGPUチップの展開において目を見張るような規模の経済を体現している。

 ほかの企業も負けてはいられない。Googleは米国時間3月12日、最新のオープンソース大規模言語モデル(LLM)「Gemma 3」が、推定計算能力のごく一部でDeepSeekのLLM「R1」に迫る精度を出したと発表した。

 Googleは、対戦型の競技に広く使用されている指標「イロレーティング」を用いながら、Gemma 3のスコアがDeepSeekのR1の98%に達していると主張している。R1のスコアは1363なのに対し、Gemma 3のスコアは1338である。

 現時点では、R1はGemma 3よりも優れているといえる。しかしGoogleの推定によると、R1のスコアを達成するにはNVIDIAの主流GPUチップ「H100」が32個必要だが、Gemma 3ではH100 GPUを1個しか使わないという。

 Googleは、同社の計算リソースとイロレーティングのバランスが非常に良いとしている。

 Googleは同社のブログ投稿で、Gemma 3を「単一のGPU、またはTPUで実行できる最も高性能なモデル」と称し、同社が独自開発した機械学習(ML)特化型のプロセッサー「Tensor Processing Unit」(TPU)に言及している。

 この投稿では「Gemma 3は、そのサイズとしては最先端の性能を発揮し、LLMの性能を評価するオープンソースプラットフォーム『LMArena』のリーダーボードにおいて、人間のフィードバックに基づく初期段階の評価では、『Llama 3.1 405B』『DeepSeek V3』『OpenAI o3-mini』を上回る結果を出している」とイロレーティングを参照しながら伝えている。

 「これにより、単一のGPUまたはTPUホスト上で動作する魅力的なユーザー体験を実現できる」

 Googleのモデルは、16個のGPUが必要と推定されるMetaの「Llama 3」のイロレーティングを上回っている。ただし、競合他社が使用しているH100チップの数はGoogleの推定値であることに注意してほしい。DeepSeekは、NVIDIAの「H800」GPUを1814個使って、R1で回答を提供する例だけを開示している。

 より詳細な情報は、HuggingFaceの開発者ブログ記事で紹介されており、Gemma 3のリポジトリーも提供されている。

 データセンターよりもデバイス上での使用を目的としたGemma 3は、R1やその他のオープンソースモデルよりもパラメーター、あるいはニューラルネットワークの「重み」の数値が大幅に低い。一般的に、パラメーターの数が多いほど、より高い計算能力が必要となる。

 Gemmaのコードにおけるパラメーター数は10億、40億、120億、270億となっており、現在の基準ではかなり少ない。これに対して、R1のパラメーター数は6710億であり、ネットワークの一部を計算に含めない、または停止することで、そのうちの370億を選択的に使用できる。

 このような効率化を実現するのは、広く用いられているAI技術「知識蒸留」である。同技術は、大きなモデルから学習済みのモデルの重みを抽出し、それをGemma 3などの小さなモデルに転送することで、そのモデルの能力を強化する。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
東芝が新経営方針、「データサービスで稼ぐ会社に」–不透明さも意思固く
IT関連
2022-06-04 13:04
生成AIツール「Adobe Firefly」、一般提供開始–商用利用が可能に
IT関連
2023-09-15 05:45
RedisとKafkaのためのサーバーレスデータプラットフォーム構築のためにUpstashが約2.3億円のシード資金獲得
IT関連
2022-03-20 11:05
知識と革新の中核担うスイス連邦工科大学–スピンオフ企業も続々
IT関連
2023-12-20 16:02
Anonymousやサイバー犯罪集団、ロシアとウクライナの衝突を受け行動開始
IT関連
2022-03-01 06:50
GitHub、Markdown構文でフローチャートやクラス図、ガントチャートなどのダイアグラムを表示できる「Mermaid」をサポート開始
GitHub
2022-02-17 11:07
マイクロソフトのマルチクラウドプラットフォームAzure Arcが機械学習のワークロードに対応
ネットサービス
2021-03-04 03:07
第1回:CPMこそDXプロジェクトが行き着く“ラストワンピース”である理由
IT関連
2023-03-18 18:28
BMWがレトロフューチャーな電動スクーター「CE 04」をついに生産開始、しかし132万円で買う人はいるのか?
モビリティ
2021-07-09 05:49
WebブラウザのBrave、独自検索エンジン「Brave Search」構築に向けてTailcat買収
アプリ・Web
2021-03-05 22:53
Googleドライブにファイル共有したくない相手をブロックする機能
アプリ・Web
2021-07-26 11:57
サイバー保険の保険料や加入率が上昇–米会計検査院レポート
IT関連
2021-05-26 17:35
メールニュースレターのShopifyを目指すLetterhead
IT関連
2021-02-02 15:13
米NY Times、読者3割増 デジタル版が牽引
IT関連
2021-05-09 21:26