DeepSeek「R1」の精度に迫る、グーグルの「Gemma 3」–処理能力と効率性を両立

今回は「DeepSeek「R1」の精度に迫る、グーグルの「Gemma 3」–処理能力と効率性を両立」についてご紹介します。

関連ワード (データマネジメント等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 AIの経済学が話題になる中、DeepSeekはGPUチップの展開において目を見張るような規模の経済を体現している。

 ほかの企業も負けてはいられない。Googleは米国時間3月12日、最新のオープンソース大規模言語モデル(LLM)「Gemma 3」が、推定計算能力のごく一部でDeepSeekのLLM「R1」に迫る精度を出したと発表した。

 Googleは、対戦型の競技に広く使用されている指標「イロレーティング」を用いながら、Gemma 3のスコアがDeepSeekのR1の98%に達していると主張している。R1のスコアは1363なのに対し、Gemma 3のスコアは1338である。

 現時点では、R1はGemma 3よりも優れているといえる。しかしGoogleの推定によると、R1のスコアを達成するにはNVIDIAの主流GPUチップ「H100」が32個必要だが、Gemma 3ではH100 GPUを1個しか使わないという。

 Googleは、同社の計算リソースとイロレーティングのバランスが非常に良いとしている。

 Googleは同社のブログ投稿で、Gemma 3を「単一のGPU、またはTPUで実行できる最も高性能なモデル」と称し、同社が独自開発した機械学習(ML)特化型のプロセッサー「Tensor Processing Unit」(TPU)に言及している。

 この投稿では「Gemma 3は、そのサイズとしては最先端の性能を発揮し、LLMの性能を評価するオープンソースプラットフォーム『LMArena』のリーダーボードにおいて、人間のフィードバックに基づく初期段階の評価では、『Llama 3.1 405B』『DeepSeek V3』『OpenAI o3-mini』を上回る結果を出している」とイロレーティングを参照しながら伝えている。

 「これにより、単一のGPUまたはTPUホスト上で動作する魅力的なユーザー体験を実現できる」

 Googleのモデルは、16個のGPUが必要と推定されるMetaの「Llama 3」のイロレーティングを上回っている。ただし、競合他社が使用しているH100チップの数はGoogleの推定値であることに注意してほしい。DeepSeekは、NVIDIAの「H800」GPUを1814個使って、R1で回答を提供する例だけを開示している。

 より詳細な情報は、HuggingFaceの開発者ブログ記事で紹介されており、Gemma 3のリポジトリーも提供されている。

 データセンターよりもデバイス上での使用を目的としたGemma 3は、R1やその他のオープンソースモデルよりもパラメーター、あるいはニューラルネットワークの「重み」の数値が大幅に低い。一般的に、パラメーターの数が多いほど、より高い計算能力が必要となる。

 Gemmaのコードにおけるパラメーター数は10億、40億、120億、270億となっており、現在の基準ではかなり少ない。これに対して、R1のパラメーター数は6710億であり、ネットワークの一部を計算に含めない、または停止することで、そのうちの370億を選択的に使用できる。

 このような効率化を実現するのは、広く用いられているAI技術「知識蒸留」である。同技術は、大きなモデルから学習済みのモデルの重みを抽出し、それをGemma 3などの小さなモデルに転送することで、そのモデルの能力を強化する。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
NTTデータ、農協の「デジタル店舗」向けにノーコード開発基盤を供給
IT関連
2022-08-03 21:15
軽量なコードエディタ「JetBrains Fleet」パブリックプレビュー開始。バックエンドをリモートマシンに分離可能
開発ツール
2022-10-18 06:21
新プランで収益悪化懸念 携帯大手増益、非通信に力
IT関連
2021-02-09 07:54
「ぼくの地球を守って」「高嶺と花」全話無料公開 白泉社のまんがアプリで
くらテク
2021-06-05 01:51
経理人材不足を感じるのは7割–ブラックライン、経理部門のDX推進と人材の実態で調査
IT関連
2022-07-16 00:54
PCデポ、HISから出向受け入れ 最大400人、顧客の“デジタル担当者”に
企業・業界動向
2021-02-09 05:56
決済データで事業運営を最適化–グローバル企業のCXを支えるAdyen
IT関連
2023-06-30 00:16
考えるだけで操作できる脳モニタリングデバイス「Cognixion One」、重度障がい者の円滑な意思疎通をアシスト
ハードウェア
2021-05-15 14:32
「かもめーる」終了 21年度から発行せず 日本郵便が発表
くらテク
2021-03-31 11:26
オンラインプログラミング学習サービスProgateが登録ユーザー数240万人と発表、人気レッスンのランキングも公開
IT関連
2022-01-21 04:42
富士通、24年度もキャリア採用拡充–新卒採用では「OPENコース」を廃止
IT関連
2024-03-21 20:08
アマゾン、時価総額が1兆ドル下落
IT関連
2022-11-12 04:02
リコージャパン、医療機器の管理支援サービス事業に参入
IT関連
2021-08-11 20:08
GMが自動運転子会社「Cruise」のソフトバンク株を買い取りへ
IT関連
2022-03-20 10:50