Meta、第2世代「MTIA」チップ発表–前世代に比べ3倍高速

今回は「Meta、第2世代「MTIA」チップ発表–前世代に比べ3倍高速」についてご紹介します。

関連ワード (ビッグデータ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Metaは米国時間4月10日、「訓練および推論アクセラレーター」(Training and Inference Accelerator:MTIA)チップの第2世代を発表した。第1世代の登場からほぼ1年後の発表であり、同チップに新たに加えられた部分は大幅なパフォーマンス向上をもたらしたと同社はアピールする。

 Metaは、Microsoft、Google、Teslaといった大手テック企業同様、カスタム人工知能(AI)ハードウェアに資金投入することでGPU大手サプライヤーNvidiaの独占力を回避しようとしている。また、資金投入は、生成AIに対する関心が急激に高まる中でNvidiaが需要に対して十分な量のチップを製造できていないことを考慮し、コンピューティングの供給を確保するための手段でもある。

 最初のバージョン同様、MTIAバージョン2チップは、メッシュ状の並列動作する回路ブロック「8X8グリッドのプロセッシングエレメント(PE)」で構成される。MTIA v1の3.5倍高速で動作するとMetaはアピールする。変数の値がゼロである「スパース」演算のようなAIタスクは7倍高速で実行するという。

 このような性能向上の背後にあるのは、チップのアーキテクチャーに対する変更、メモリーとストレージの増加だとMetaはいう。「ローカルPEストレージのサイズを3倍、オンチップSRAMを2倍、帯域幅を3.5倍、『LPDDR5』の容量を2倍にした」(同社)

 同チップは、コントラクトチップメーカー大手Taiwan Semiconductor Manufacturingが開発した5ナノメートルプロセス技術で製造されている。

 バージョン1の373平方ミリメートルに対して421平方ミリメートルと大型化したバージョン2は、24億ゲートを搭載し、毎秒1億300万回の浮動小数点演算の実行が可能とMetaは語る。前世代では11億ゲートと6500万演算だった。

 MTIA v1同様、オープンソースの開発者フレームワークでMetaが開発した「PyTorch」を使ってプログラムを最適化するソフトウェアを実行する。2つのソフトウェアコンパイラーが連携しており、フロントエンドのソフトウェアは、プログラムの計算グラフをコンパイルし、バックエンドにあるソフトウェアは、オープンソースの「Triton」コンパイラー言語で書かれ、チップに最適なマシンコードを生成する。

 MTIA v1向けのソフトウェア開発作業により、新しいチップを迅速に実現できたという。「最初のシリコンから16リージョンで稼働する量産モデルへと9カ月未満で移行できた」とMetaは述べる。チップは、ランキングおよびレコメンデーション広告モデルを支援するために展開されているという。

 Metaは、72基のMTIA v2を並列に動作させるラックマウント式のコンピューターシステムを設計している。「当社の設計は、高い演算能力、メモリー帯域幅、メモリー容量を備えた高密度の性能を提供することを可能にする」と同社はいい、「この密度は、より幅広いモデルの複雑性とサイズに簡単に対応することを確実にする」と続ける。

 同社は、カスタムハードウェアデザインへの資金投入を継続する計画だ。「現在、複数のプログラムが進行中だ。それらは、MTIAの範囲を拡張することを目標としており、生成AIワークロードに対するサポートが含まれる」という。「既存インフラとともに、将来的に利用可能になると思われる新しくより高度なハードウェア(次世代の生成AIを含む)と連携して動作するカスタムシリコンを設計している」と同社は語る。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
サイバー攻撃で暗躍するイニシャルアクセスブローカー、犯罪凶悪化の温床にも
IT関連
2024-10-19 17:24
コクヨGの物流企業、ピッキングアシストロボットを導入–AIが最短ルート提案
IT関連
2024-06-15 14:19
パスキーによるパスワードレス認証への対応が拡大–FIDOアライアンスが報告
IT関連
2022-12-20 00:20
AppleのDolby Atmos空間オーディオをビートルズ「Abbey Road」で体験 空間オーディオの制作も試してみる (1/4 ページ)
イラスト・デザイン
2021-06-30 15:26
「プライバシーに投資できない企業は淘汰される」–NRIが提言
IT関連
2022-06-23 18:00
Google Cloud FunctionsがPHPをサポート開始。PHPでサーバレスの関数が記述可能に
Google
2021-04-26 13:02
「Microsoft 365 Copilot」、早期アクセスプログラムが開始
IT関連
2023-05-11 08:06
NECと石坂産業、ローカル5GとAIを活用したスマートプラントで実証実験
IT関連
2023-01-19 15:41
企業のLINE活用、見直しの動き鈍く
IT関連
2021-03-26 22:41
WebAssemblyランタイム「Wasmer 2.1」リリース。WASI用に仮想ファイルシステムを実装し、ブラウザでもWASIが利用可能に
Deno
2022-01-12 18:47
デジタルツインの理解度は76.6%、デジタル化対象の最多は「複雑な製品や機械」
IT関連
2024-08-24 15:53
法令違反で10億円か売上高の5%–注意を払うべき中国「データ3法」の対応策
IT関連
2022-10-19 07:31
Kubernetesに最適化されたコンテナランタイム「cri-o」、十分成熟したプロジェクトとしてCNCFの卒業プロジェクトに
Docker
2023-08-08 23:17
Disney+は今夏、新たに42カ国と11の地域でサービス開始
IT関連
2022-01-30 22:07