DeepSeekのAIを30倍高速化–「NVIDIA GTC」で発表されたこと

今回は「DeepSeekのAIを30倍高速化–「NVIDIA GTC」で発表されたこと」についてご紹介します。

関連ワード (データマネジメント等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 2025年1月、大規模言語モデル(LLM)「DeepSeek-R1」の登場は、株式市場の急落をもたらした。その7週間後、AI処理の分野で先陣を切るチップ大手のNVIDIAは、DeepSeekがもたらす安価なAI経済の中心に自社を据えようとしている。

 NVIDIAの共同創業者で最高経営責任者(CEO)のJensen Huang氏は米国時間3月18日、カリフォルニア州サンノゼの「SAP Center」で開催中の開発者向け年次イベント「NVIDIA GTC 2025」(3月16~21日)において、同社のGPU「Blackwell」がいかにしてDeepSeek-R1の推論性能を大幅に向上させるかを語った。

 NVIDIAは、今回発表されたオープンソースの推論ソフトウェア「NVIDIA Dynamo」によって、Blackwellは、DeepSeek-R1が通常のデータセンターの約30倍の処理能力を持つと主張している。これは、1秒当たりのトークン数で測定される。

 NVIDIAでハイパースケールおよび高性能コンピューティングの責任者を務めるIan Buck氏は、事前に開かれた記者会見で「Dynamoはその利点を生かし、DeepSeekをはじめとした推論モデルに対して、同じ数のGPUと同じアーキテクチャーで30倍以上の性能を提供する」と述べた。

 3月18日から「GitHub」で入手可能なDynamoは、推論作業を最多1000個のNVIDIAのGPUチップに分散させる。作業を分散して並列処理することで、1秒当たりに達成できる作業量を増やすことが可能となる。

 その結果、100万トークン当たり1ドルが課される推論タスクでは、1秒当たりに実行できるトークンの数が増え、GPUを提供するサービスの1秒当たりの売り上げが増加する。

 Buck氏は「サービスプロバイダーは、DeepSeek上でより多くの顧客からのクエリー(問い合わせ)を実行するか、あるいは特定の顧客に多くの処理能力を割り当て、プレミアムサービスとして追加料金を請求するかを選べる」と述べた。

 Buck氏は「AIファクトリーは、100万トークン当たりのプレミアム料金で、より高品質なサービスを提供できる」とした上で、「ファクトリー全体のトークン総量も増やせる」と続けた。AIファクトリーはNVIDIAの造語で、チップ、ソフトウェア、ラックベースの機器を用いて大量のAI作業を実行する大規模サービスを指す。

 「より多くのチップを使用することで、AI推論のスループットを増やし、ひいてはビジネスも成長させる」というNVIDIAの見通しは、「DeepSeekは各クエリーに必要な処理量を削減できるため、コンピューターの処理能力全体の使用量が減少するのではないか」という投資家の懸念に対する答えとなる。

 Buck氏によると、DynamoとBlackwellを併用することで、AIデータセンターが旧モデル「Hopper」を使用した場合の約50倍の売り上げを生み出すことが可能になるという。

 NVIDIAは、DeepSeek-R1を独自に改良したものを「HuggingFace」に共有した。NVIDIA版では、R1が変数を操作するために使用するビット数を「FP4」(浮動小数点4ビット)に削減する。これは、「B-float 16」(標準の浮動小数点32ビット)に必要な計算量のごく一部である。

 「Blackwellの性能は、Hopperから大幅に向上した」とBuck氏は言う。「精度モデルに大きな変更や削減、損失をもたらすことなく実現した。高品質な推論トークンを生成するモデルであることに変わりはない」

 Huang氏は、Blackwellの最新版「Blackwell Ultra」も発表した。Ultraでは、DRAM(Dynamic Random Access Memory)を192GBの広帯域メモリー「HBM3E」から最大288GBに増やすなど、さまざまな面を強化している。

 CPU「NVIDIA Grace」と組み合わせると、ラックベースのコンピューター「NVIDIA GB300 NVL72」に合計72個のUltraを組み込める。このシステムでは、FP4で実行される推論能力は、「GB200」をベースとした既存のNVL72と比較して、50%以上向上している。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
業務時間外にメール対応しない「つながらない権利」–コロナ禍で新たな動きに注目
IT関連
2021-05-01 22:37
街の「にぎわい」など任意エリアのKPIを可視化しSNSトレンドと組み合わせ変化要因を示唆する「clarea」提供開始
人工知能・AI
2021-06-18 17:16
HashiCorp、「HCP Waypoint」にアクションを間もなく追加へ–テンプレートとアドオンも強化
IT関連
2024-06-07 09:59
Clubhouse、米大手VC主導のシリーズCラウンド増資 クリエイター支援とスケーリングにフォーカス
企業・業界動向
2021-04-20 03:58
自治体業務のアウトソーシング市場が縮小–コロナ禍の反動とガバメントクラウドで
IT関連
2023-09-17 04:14
グーグル、「Gmail」にAIアシスタント「Gemini」を統合
IT関連
2024-06-27 01:58
PS5に初の大型アプデ USBストレージへのPS5タイトル保存、PS4とのシェアプレイなど 14日から
くらテク
2021-04-14 07:20
凸版印刷、遠隔操作ロボットで看護業務支援を実証
IT関連
2022-03-08 13:19
新潟県柏崎市、「ChatGPT」を活用した業務効率化ツールで年240時間分の工数削減へ
IT関連
2023-11-21 13:11
Clubhouseで注目度が上がる「音声」を技術的に見る 説得力のある声を伝えるために知っておくべきこと (1/2 ページ)
イラスト・デザイン
2021-03-05 15:16
長野県塩尻市、「クラウド電話+BYOD端末」の活用を実証実験
IT関連
2022-10-27 21:51
「チェンソーマン」作者の新作読み切り「ルックバック」、一晩で閲覧120万超え 「ジャンプ+」で無料公開中
くらテク
2021-07-20 20:14
ノーコードでWireGuardフルメッシュVPNを企業ネットワークに提供するSaaS「Wissy」がβ版ユーザー募集開始
IT関連
2022-01-25 04:41
東京で走り出した電動キックボードシェア「Luup」 思い知った最高時速15kmの現実 (1/3 ページ)
くわしく
2021-05-15 16:12