[速報]AWS、大規模言語モデルのトレーニングに最適化した独自プロセッサ「AWS Trainium2」発表。前モデルより最大4倍のトレーニング性能。AWS re:Invent 2023

今回は「[速報]AWS、大規模言語モデルのトレーニングに最適化した独自プロセッサ「AWS Trainium2」発表。前モデルより最大4倍のトレーニング性能。AWS re:Invent 2023」についてご紹介します。

関連ワード (正式、第一世代、高効率等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


Amazon Web Services(AWS)は、ラスベガスで開催中のイベント「AWS re:Invent 2023」の基調講演で、AIのトレーニングに最適化した独自プロセッサ「AWS Trainium2」を発表しました。

fig

Trainium2は、最大数兆個のパラメータを持つ基盤モデルおよび大規模言語モデルのトレーニング用に設計されています。

2020年に発表された第一世代のTrainiumチップと比較して、最大4倍のトレーニング性能と3倍のメモリ容量を実現し、エネルギー効率(性能/ワット)を最大2倍まで改善するように設計されています。

fig

Trainium2は、単一のインスタンスに16個のTrainiumチップを含むAmazon EC2 Trn2インスタンスで利用可能になります。

Trn2インスタンスは、AWS Elastic Fabric Adapter(EFA)のペタビットスケールネットワーキングで相互接続された次世代EC2 UltraClusterにおいて、Trainium2チップを最大10万個までスケールアップできるようになり、このレベルのスケールでは3000億パラメータの大規模言語モデルを数週間から数カ月でトレーニングできると説明されています。

AWS re:Invent 2023の主な発表

Day 0:Monday Night Live

  • AWS、スケーラブルなNFS「Amazon EFS」で、長期保存データ用の「Amazon EFS Archive」提供開始
  • AWS、シンクライアント専用デバイス「Amazon WorkSpaces Thin Client」発表
  • [速報]AWS、読み込み性能も書き込み性能もスケールする「Amazon Aurora Limitless Database」プレビューを発表。AWS re:Invent 2023
  • [速報]AWS、SPARCサーバを仮想化してAWSに載せる「Virtualization for SPARC on AWS with Stromasys」発表。AWS re:Invent 2023
  • [速報]AWS、必要なときに1分以内にキャッシュが提供され自動的にスケールする「Amazon ElastiCache Serverless」正式サービス化を発表。AWS re:Invent 2023

Day 1:Keynote by AWS CEO Adam Selipsky

  • [速報]AWS、従来のAmazon S3より最大10倍高速な「Amazon S3 Express One Zone」発表。AWS re:Invent 2023
  • [速報]AWS、ARMベースの最新独自プロセッサ「Graviton4」発表、Graviton3より30%高速、より高効率に。AWS re:Invent 2023
  • [速報]AWS、大規模言語モデルのトレーニングに最適化した独自プロセッサ「AWS Trainium2」発表。前モデルより最大4倍のトレーニング性能。AWS re:Invent 2023
  • [速報]AWS、Copilot対抗となる「Amazon Q」発表。生成AIによるシステム開発支援や業務支援など、多様なAIサービスを提供。AWS re:Invent 2023
  • [速報]古いJavaや.NETのコードを最新のJavaにAIが自動変換する「Amazon Q Code Transformation」、AWSが発表。AWS re:Invent 2023

COMMENTS


Recommended

TITLE
CATEGORY
DATE
ソニー「α1」は“新世代の最高峰”を見せてくれた :荻窪圭のデジカメレビュープラス
くらテク
2021-01-29 07:52
格安スマホ、低容量で対抗プラン続々も、忍び寄る大手の触手
IT関連
2021-02-03 15:15
関西電力、生活サービス特化のECモール開設 顧客囲い込み
IT関連
2021-03-04 03:22
News Corpにサイバー攻撃–WSJやNew York Postが標的に
IT関連
2022-02-08 18:40
医師向け臨床支援アプリを提供する「HOKUTO」を提供するHOKUTOが8.25億円のシリーズA調達
IT関連
2022-02-10 05:08
ビジュアルワークスペース「Miro」、50の新機能を第1四半期に追加
IT関連
2023-07-02 21:20
「SAP Build」でフュージョン開発を実現–SAP幹部に聞く「SAP BTP」の方向性
IT関連
2024-01-18 10:27
ドキュサインの電子署名、国や地方公共団体との電子契約に利用可能に
IT関連
2022-08-06 20:34
過去の子供の3Dデータと比べて成長を実感、ARを使った子供の成長記録アプリ「せいくらべ」
IT関連
2021-03-10 16:58
カラーフォントとバリアブルフォントで文字表現を超えたクリエイティブへ 日本語Adobe Fontsの新たな地平 (1/2 ページ)
イラスト・デザイン
2021-04-21 11:33
炭素排出量・ESG管理のB2BプラットフォームのドイツPlan Aが約3.3億円調達
EnviroTech
2021-03-12 16:32
日本KFC、クロスチャネルの顧客体験を強化–巣ごもり需要などでリピート客の獲得が加速
IT関連
2022-02-04 07:40
次世代ライブビデオアプリを強化する100msが約23.3億円を調達
IT関連
2022-03-13 13:09
NVIDIAがサイバーセキュリティのインシデントを調査中、2日間デベロッパーツールとeメールがダウン
IT関連
2022-02-27 09:10