Google、第6世代のAI専用TPU「Trillium」発表。前世代より約5倍の性能向上、2倍のメモリ容量と帯域など
今回は「Google、第6世代のAI専用TPU「Trillium」発表。前世代より約5倍の性能向上、2倍のメモリ容量と帯域など」についてご紹介します。
関連ワード (大規模、速報、間相互接続等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
Googleは、日本時間5月15日から開催中のイベント「Google I/O 2024」で、TPU v5eに続く第6世代のAI専用TPU(Tensor Processing Unit)である「Trillium」を発表しました。
Trilliumは前世代のTPUとなるTPU v5eと比較して、チップあたりのピーク演算性能が4.7倍。高帯域幅メモリー(HBM:High Bandwidth Memory)の容量と帯域幅が2倍になり、チップ間相互接続(ICI: Interchip Interconnect)の帯域幅もTPU v5eに比べて2倍になりました。
さらに、Trillium TPUは、TPU v5eよりも67%以上エネルギー効率が向上しているとのこと。
Trilliumは、単一の高帯域幅、低レイテンシを備えたポッドで最大256 TPUまで拡張でき、さらに並列処理などを実現するマルチスライステクノロジーとTitanium Intelligence Processing Units (IPU)により数百のポッドに拡張することで、数万チップの接続が可能なビルディングスケールのスーパーコンピュータとなります。
これにより、大規模な基盤モデルをより速くトレーニングし、レイテンシーを削減し、低コストでこれらのモデルを提供することを可能にすると説明されています。
Trilliumは2024年後半にクラウドユーザーに提供予定です。
Google I/O 2024バックナンバー
- [速報]Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開
- Google、第6世代のAI専用TPU「Trillium」発表。前世代より約5倍の性能向上、2倍のメモリ容量と帯域など
- Flutter/DartのWebAssemblyコンパイル機能が安定版に。より高速でスムーズなユーザー体験などを実現
- Chrome DevToolsにもGeminiを搭載へ。エラーの解決策などAIが支援