AWS、新型チップ「Trainium2」「Graviton4」を発表–NVIDIAとの提携も拡大

今回は「AWS、新型チップ「Trainium2」「Graviton4」を発表–NVIDIAとの提携も拡大」についてご紹介します。

関連ワード (ITインフラ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Amazon Web Services(AWS)は米国時間11月28日、ラスベガスで開催中の年次開発者会議「AWS re:Invent」で、ニューラルネットワークの学習専用チップの新バージョン「Trainium2」を発表した。Trainium2は大規模言語モデル(LLM)と基盤モデルの学習に特化して設計されている。

 AWSはまた、クラウド向けプロセッサーの新バージョン「Graviton4」を発表したほか、NVIDIAとの提携を拡大し、AWSのクラウドコンピューティングサービスでNVIDIAの最先端のチップを稼働させることを明らかにした。

 Trainium2は、数兆個ものパラメーター(重み係数)を持つニューラルネットワークを処理するように設計されている。これらのパラメーターが、いわばプログラムのアルゴリズムの役割を担い、スケールとパワーをもたらす。AI業界全体として重点的に取り組んでいるのが、パラメーターをさらに大規模に拡張することだ。

 パラメーター数を兆単位にすることが重視されるのは、人間の脳のニューロン(神経細胞)が100兆個以上のシナプスで結合されていると考えられていることも一因だろう。そのため、1兆個のパラメーターを持つニューラルネットワークプログラムとなれば、実際にそうであるかどうかは別として、人間の脳と関連があるように見える。

 AWSによると、Trainium2は現行モデルより「学習性能を最大4倍高速化し、メモリー容量を最大3倍増やすよう設計されている」一方で、「エネルギー効率(ワットあたりのパフォーマンス)は最大2倍向上した」という。

 AWSはTrainium2を、クラウドコンピューティングサービス「Amazon Elastic Compute Cloud(Amazon EC2)」の「Trn2」インスタンスで利用できるようにする。このインスタンスでは、Trainium2チップ16基が連携して動作する。「EC2 UltraClusters」では10万チップまで拡張できるという。これらは同社のネットワーキングシステム「Elastic Fabric Adapter(EFA)」を利用して相互接続され、合計65エクサFLOPSの処理能力を提供できる(1エクサFLOPSは、浮動小数点演算を毎秒100京回行える性能を表す)。

 AWSによると、この規模の処理であれば、「顧客はパラメーターが3000億個のLLMを、数カ月ではなく数週間でトレーニングできる」という。

 顧客向けのサービスに加えて、AmazonにはAIチップの限界に挑み続ける動機が他にもある。同社は9月、OpenAIの元幹部らが設立した株式非公開の新興企業で、生成AIを手がけるAnthropicに最大40億ドル(約5900億円)を出資すると発表した。この出資により、同社はMicrosoftとOpenAIの独占的な提携関係に対抗できる立場になる。

 Armが持つマイクロプロセッサーの知的財産を基盤に開発されたGraviton4チップは、従来のx86チップ規格をベースにしたIntelやAdvanced Micro Devices(AMD)のプロセッサーと競合する。AWSはGraviton4について、「Graviton3」と比べて「演算性能が30%向上した」としている。

 Amazonの発表の2週間ほど前、Microsoftは同社初のAI向けチップ「Microsoft Azure Maia 100 AI Accelerator」を発表した。Amazon、Microsoftと並ぶクラウド大手であるAlphabet傘下のGoogleは、2016年に初のAI向けクラウドチップ「Tensor Processing Unit(TPU)」を両社に先駆けて発表し、その後もTPUを複数世代にわたり進化させている。

 新チップ2製品に加え、AmazonはAIチップ大手NVIDIAとの戦略的提携を拡大したと発表した。AWSは、ArmベースのCPU「Grace」とGPU「Hopper」を組み合わせたNVIDIAのマルチチップ製品「GH200 Grace Hopper」を搭載する最初のクラウドサービスになる見込みだ。

 8月に発表され2024年出荷開始予定のGH200チップは、2023年入って発表されたGrace Hopperの次期バージョンだ。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
ファイブアイズ、重要インフラ狙うロシア関連のサイバー攻撃に注意喚起
IT関連
2022-04-23 13:07
Datadog、「Datadog Monitoring for Oracle Cloud Infrastructure(OCI)」を一般提供
IT関連
2024-09-13 17:15
「iOS 16」で送信したメッセージを編集・削除–パブリックベータ版で新機能を試す
IT関連
2022-07-17 18:08
「クラシル」運営dely、三菱食品と提携–店頭サイネージでレシピを配信
IT関連
2024-01-25 07:52
企業秘密を盗用されたと主張するWisk AeroのArcher Aviationに対する仮差止請求を連邦判事が却下
モビリティ
2021-07-27 22:07
LiDAR業界の勢力争いとVelodyneの内部問題
モビリティ
2021-08-09 18:27
NEC、AIで部品購買業務の納期調整を自動化
IT関連
2024-11-14 12:46
ゼロトラストでセキュリティ損害の削減効果は26億円–イルミオ調べ
IT関連
2022-06-03 18:00
オフィスで在宅メンバーとハイタッチ–日建設計らが目指す、空間を超えたふれあい
IT関連
2022-11-12 06:36
AIの普及はローコード/ノーコード開発にどのような影響を与えるのか
IT関連
2024-02-29 20:06
日産自動車、統合人事システムとBPOサービスを導入–年末調整の98%をペーパーレス化
IT関連
2023-03-24 06:17
インターネット犯罪被害額は2021年も拡大、69億ドル超に–FBI報告書
IT関連
2022-03-24 03:51
Spotify、新しいインターフェース「Car Mode」を一部ユーザーでテスト中
IT関連
2022-03-27 13:19
成田と羽田で“顔パス”搭乗スタート 顔認証でチェックインなどを非接触化
企業・業界動向
2021-03-26 09:39