DeepSeek「R1」の精度に迫る、グーグルの「Gemma 3」–処理能力と効率性を両立

今回は「DeepSeek「R1」の精度に迫る、グーグルの「Gemma 3」–処理能力と効率性を両立」についてご紹介します。

関連ワード (データマネジメント等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 AIの経済学が話題になる中、DeepSeekはGPUチップの展開において目を見張るような規模の経済を体現している。

 ほかの企業も負けてはいられない。Googleは米国時間3月12日、最新のオープンソース大規模言語モデル(LLM)「Gemma 3」が、推定計算能力のごく一部でDeepSeekのLLM「R1」に迫る精度を出したと発表した。

 Googleは、対戦型の競技に広く使用されている指標「イロレーティング」を用いながら、Gemma 3のスコアがDeepSeekのR1の98%に達していると主張している。R1のスコアは1363なのに対し、Gemma 3のスコアは1338である。

 現時点では、R1はGemma 3よりも優れているといえる。しかしGoogleの推定によると、R1のスコアを達成するにはNVIDIAの主流GPUチップ「H100」が32個必要だが、Gemma 3ではH100 GPUを1個しか使わないという。

 Googleは、同社の計算リソースとイロレーティングのバランスが非常に良いとしている。

 Googleは同社のブログ投稿で、Gemma 3を「単一のGPU、またはTPUで実行できる最も高性能なモデル」と称し、同社が独自開発した機械学習(ML)特化型のプロセッサー「Tensor Processing Unit」(TPU)に言及している。

 この投稿では「Gemma 3は、そのサイズとしては最先端の性能を発揮し、LLMの性能を評価するオープンソースプラットフォーム『LMArena』のリーダーボードにおいて、人間のフィードバックに基づく初期段階の評価では、『Llama 3.1 405B』『DeepSeek V3』『OpenAI o3-mini』を上回る結果を出している」とイロレーティングを参照しながら伝えている。

 「これにより、単一のGPUまたはTPUホスト上で動作する魅力的なユーザー体験を実現できる」

 Googleのモデルは、16個のGPUが必要と推定されるMetaの「Llama 3」のイロレーティングを上回っている。ただし、競合他社が使用しているH100チップの数はGoogleの推定値であることに注意してほしい。DeepSeekは、NVIDIAの「H800」GPUを1814個使って、R1で回答を提供する例だけを開示している。

 より詳細な情報は、HuggingFaceの開発者ブログ記事で紹介されており、Gemma 3のリポジトリーも提供されている。

 データセンターよりもデバイス上での使用を目的としたGemma 3は、R1やその他のオープンソースモデルよりもパラメーター、あるいはニューラルネットワークの「重み」の数値が大幅に低い。一般的に、パラメーターの数が多いほど、より高い計算能力が必要となる。

 Gemmaのコードにおけるパラメーター数は10億、40億、120億、270億となっており、現在の基準ではかなり少ない。これに対して、R1のパラメーター数は6710億であり、ネットワークの一部を計算に含めない、または停止することで、そのうちの370億を選択的に使用できる。

 このような効率化を実現するのは、広く用いられているAI技術「知識蒸留」である。同技術は、大きなモデルから学習済みのモデルの重みを抽出し、それをGemma 3などの小さなモデルに転送することで、そのモデルの能力を強化する。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
ソニーが立体音響「360 Reality Audio」を4月16日国内展開、対応ワイヤレススピーカーも発表
ハードウェア
2021-03-24 09:58
NVIDIA CEO、AIにより人間の言葉がプログラミング言語となったことで、プログラミングを学ぶことは重要でなくなった、と発言
NVIDIA
2024-03-12 08:39
患者の潜在的な訴えを抽出–TISと国立がん研究センター東病院が共同研究
IT関連
2022-01-22 03:48
企業が推進するエッジ利用–効果的なデータ活用に課題
IT関連
2023-05-19 13:51
東大「Oracle Cloud ERP」で財務会計システム刷新–データ駆動型経営へ
IT関連
2024-10-20 05:46
ドルビーが超低遅延ストリーミングプラットフォームのMillicastを買収
IT関連
2022-02-05 19:58
「かまいたちの夜」初のパチスロ化 キャラデザはオリジナルか
くらテク
2021-07-20 11:07
Intel、nmではない新命名法でのロードマップを発表 次は「Intel 7」に
企業・業界動向
2021-07-28 14:57
PCの数と資産台帳の数字が合わない–そこに潜む根深い原因
IT関連
2023-02-14 15:45
第1回:デジタルマーケティングのインハウス化がなぜ必要なのか
IT関連
2021-02-08 19:06
三菱重工、グループ共通の直接材調達・購買管理システムを刷新
IT関連
2024-10-23 21:06
Denoが大幅な方針変更を発表。3カ月以内にnpmパッケージへの対応を実現、最速のJavaScriptランタイムを目指しHTTPサーバを刷新
Deno
2022-08-18 11:50
デバイスライフサイクル全体のセキュリティ課題が明らかに–HP調査
IT関連
2025-02-05 14:48
日本郵政、社内外との情報共有基盤としてBoxを採用
IT関連
2022-03-04 09:39