さくらインターネット、「高火力 DOK」で「NVIDIA H100プラン(β版)」提供

今回は「さくらインターネット、「高火力 DOK」で「NVIDIA H100プラン(β版)」提供」についてご紹介します。

関連ワード (クラウド等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 さくらインターネットは8月27日、生成AI向けクラウドサービス「高火力」のコンテナーシリーズ「高火力 DOK」で「NVIDIA H100プラン(β版)」を提供した。

 同プランでは、「NVIDIA H100 TensorコアGPU」を採用。既存の「NVIDIA V100プラン」に比べて計算速度とGPUメモリーの容量が大幅に向上したため、高精細画像の多数生成、大規模言語モデル(LLM)におけるファインチューイング、AIモデルを活用した推論などをより高速に実施できるプランだと同社は説明する。

 プラットフォームはLinux/AMD64。GPUメモリーは80GB。1時間当たり1008円(0.28円/秒)で利用可能。コンテナー実行開始から終了までの実行時間が課金対象となる。タスクの実行、タスクモニタリング、ログ管理が利用可能な機能として用意されている。

 β版提供とのことで、障害発生時には、復旧に時間を要する場合があるという。β版終了時期について、「H100が供給できる数にまだ限りがあることから、幅広く計算資源を用意できたタイミング」とさくらインターネットで副社長 執行役員を務める舘野正明氏は語る。「当社もGPUを分割して環境を提供するというところの事業経験が深まっていないことから、サービス品質保証(SLA)なども含めて、プロダクション環境として完全に提供できるという確認が取れ次第」と続ける。

 さくらインターネットは1月に高火力シリーズ第1弾となる「高火力 PHY」を提供している。H100を8基搭載したベアメタルサーバーで、同社の石狩データセンターに設置されており、申し込みから最短10分で利用が可能。複雑なデータセットの解析やLLMのトレーニングに向いているという。

 シリーズ第2弾として6月27日に提供された高火力 DOKは、「Docker」イメージの実行ができるコンテナーシリーズ。毎回同じ環境でGPUを使ったタスクが実行できるため、スポットでの利用に向いている。月額制の高火力 PHYとは異なり時間課金制のため1秒単位で利用できる。

 今後の展開としては、2024年内には「高火力 VM版」(仮称)が予定されている。NVIDIAのGPUを搭載した物理サーバー上で複数の仮想サーバーを構築し、その一つ一つを顧客に提供する。利用時間に応じた従量課金制を予定しており、機械学習のスポット利用やAIアプリケーションの開発が用途として考えられている。

 また、同社は、コンテナー型データセンターの整備も予定している。6月に約170億円のデータセンターへの投資を決定しており、これにより既に発注している214億円分のGPUサーバーを今期中に設置して、収益化する予定。コンテナー型データセンターには水冷式サーバーを設定するという。

 さらに、サービスの更なる増強に向け、最新のGPUやデータセンター拡張へ1000億円の投資も計画されている。生成AI向けGPUクラウドサービスの第2次投資計画について、2024年4月に経済産業省による「クラウドプログラム」供給確保計画の認定を受け、実際の投資額に対して2分の1(最大約500億円)の助成を受ける予定。現時点で最新となるNVIDIAの「HGXB200」システムを皮切りに、次世代GPUを継続的に整備していく。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
アリババ、経営陣の異動を実施–CEOがAlibaba Cloudの社長代理も兼任
IT関連
2023-01-05 16:56
不二越、3200人の従業員に「SAP Concur」導入–事務負担の軽減実感
IT関連
2022-07-28 03:50
津波シミュレーターに竜巻発生装置……最新の「気象科学館」人気
IT関連
2021-02-16 19:59
新興電気自動車メーカーRivianが第4四半期の決算を発表、株価は最安値を更新
IT関連
2022-03-13 18:52
筋トレゲーム「リングフィット」の最速クリア新記録へ 記録保持者の挑戦が話題
ネットトピック
2021-08-12 15:52
「Linux」でグループを効率的に管理するために習得すべきコマンド5選
IT関連
2024-08-23 18:48
一時低迷していたクラウドインフラのグローバル成長率、再上昇へ。2024年第1四半期は前年比21%成長、日本は25%以上の高成長。Synergy Research Group
AWS
2024-05-29 13:03
アストンマーティンDBXは老舗ブランドの野心と苦心が共存する高級SUV
モビリティ
2021-03-07 01:39
TikTokで黒人クリエーターたちがストライキ、クリエイティブの搾取を訴える
ネットサービス
2021-06-29 21:55
東証マザーズ上場の「QDレーザ」がメディアラウンドテーブル開催、事業内容や今後の戦略を紹介
ハードウェア
2021-02-06 04:39
Microsoft、「Surface Laptop 4」発売 AMDの13.5インチが12万8480円から
製品動向
2021-04-15 08:51
ピュア・ストレージ、フラッシュベースのネイティブな統合型ブロック/ファイルストレージを提供
IT関連
2023-04-29 23:31
医療業界がランサムウェア攻撃の標的に–TXOne、OT領域における脅威動向を解説
IT関連
2024-02-08 22:57
「いらすとや」10年目 毎日更新、忙しすぎて終了へ 「心配かけると悪い」と事前に報告
IT関連
2021-01-26 19:37