インテル、データセンター向けAIプロセッサー「Habana Gaudi2」発表–「IPU」ロードマップも

今回は「インテル、データセンター向けAIプロセッサー「Habana Gaudi2」発表–「IPU」ロードマップも」についてご紹介します。

関連ワード (ITインフラ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Intelは、ディープラーニング(DL)の訓練および推論向けの最新世代プロセッサー「Habana Gaudi2」「Habana Greco」を発表した。データセンターにおけるワークロードの訓練や推論のデプロイメント向けに高性能、高効率の深層学習コンピュートの選択肢を提供するとともに、どのような規模の企業にもAIの取り組みへの障壁を低減するといった狙いがある。また同社は「Intel Vision」イベントで、ビジネス顧客に向け、同社のIPU(インフラストラクチャープロセシングユニット)とGPUのポートフォリオに関する詳細を明らかにした。

 Intel傘下のHabana Labsの最高執行責任者(COO)Eitan Medina氏は、イベントに先駆け、報道陣に対して、「AIはデータセンターのけん引力になっている」と述べた上で、IntelのデータセンターチームはAIのDLプロセッサーテクノロジーに注力していると語った。「これは最も重要な応用であり、最も著しい成長を見せている。しかしさまざまな顧客が独自の応用に向け、それぞれにテクノロジーを組み合わせている」(Medina氏)

 Intelがデータセンター向けとして多様なチップに投資しているのは、ユースケースがこのように多岐にわたっているためだ。HabanaプロセッサーはDLタスクのコンピュート能力を必要としている顧客に向けたものだ。例えば、新たなGaudi2プロセッサーによって、自動運転車、医療画像、製造分野での欠陥検出で利用されるアプリケーションのビジョンモデリングを改善できるようになる。Intelは2019年、イスラエルを拠点とするプログラマブルチップメーカーのHabana Labsを約20億ドルで買収している。

 第2世代のGaudi2プロセッサー、Grecoプロセッサーはいずれも、前世代で採用していた16nmプロセスではなく7nmプロセスを採用して製造されている。またこれらのプロセッサーはHabanaの高効率アーキテクチャーを採用している。

 Intelは同日、Gaudi2と「NVIDIA A100 80GB GPU」を比較した場合、コンピュータービジョンモデルの「ResNet-50」と自然言語処理(NLP)モデル「BERT」の双方で、Gaudi2は2倍の訓練スループットを実現していると紹介した。

 Medina氏は、「同じプロセスノードとほぼ同じダイサイズで製造されているA100 GPUと比較した場合、Gaudi2は同一条件下での主要ワークロードの比較で示されているように、明らかに優れた訓練パフォーマンスを実現している」とし、「DLを高速化するこのアーキテクチャーは、根本的により効率的なものであり、盤石なロードマップに支えられている」と述べた。

 Gaudi2が実現する深層学習訓練の効率化に関するさらなる詳細は以下の通りだ。

 Gaudi2プロセッサーはHabanaの顧客向けに、既に提供が開始されている。HabanaはSupermicroとパートナーシップを組んでおり、2022年に「Supermicro Gaudi2 Training Server」を提供しようとしている。

 Greco推論プロセッサーは、2022年後半から一部の顧客に向け、サンプル提供が開始される予定だ。

 Grecoに関するさらなる詳細は以下の通り。

 IntelのエグゼクティブバイスプレジデントSandra Rivera氏は、「Gaudi2は、ますます大規模で複雑になる深層学習のワークロードを高速に効率的に訓練するよう支援できる」と述べている。

 またIntelは、IPUポートフォリオに関する2026年までのロードマップも披露した。まず、クラウド大手、GoogleやFacebookなどのハイパースケーラー向けのIPUを開発したが、現在アクセスを拡大している。

 2022年には2種類のIPUを出荷する。ASIC IPU「Mount Evans」、第2世代FPGA IPU「Oak Springs Canyon」をGoogleなどのプロバイダーに出荷する。2023/2024年には、400GBのIPU「Mount Morgan」「Hot Springs Canyon」、2025/2026年には、次世代の800GB IPUを顧客やパートナーに出荷する予定だ。

 Intelは、データセンター向けGPU(開発コード名「Arctic Sound-M/ATS-M」)の詳細も披露した。AV1ハードウェアエンコーダーを搭載する業界初のディスクリートGPUだ。ATS-Mは150兆回/秒(TOPS)の性能を想定している。2つのフォームファクターが用意され、Dell、Supermicro、Cisco、Inspur、H3C、Hewlett Packard Enterprise(HPE)などのパートナーから、15以上の搭載システムが提供される予定だ。2022年第3四半期に提供が開始される見通しだ。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
AWS、IPv4アドレスの使用に課金、1時間当たり0.005ドル。2024年2月1日から
AWS
2023-07-31 16:51
契約情報を活用して“企業力”を高めるリーガルテック
IT関連
2023-09-21 07:31
屋外でもコロナ感染リスク、スパコン「富岳」飛沫シミュレーション 
IT関連
2021-05-07 15:01
セキュリティを軸に社会全体の安全なDXに貢献–アシュアード・大森社長
IT関連
2024-01-06 04:35
インテルとドコモ、LTE/5G対応PCの企業展開に向け協業
IT関連
2021-04-21 19:27
MySQLの新サービス「HeatWave」、SQLそのままで最大3000倍高速に。DMM.comが検証[PR]
MySQL
2021-05-17 06:29
カルビー、AI搭載の生産計画立案システムを導入–業務負荷を低減し生産性を向上
IT関連
2022-08-11 12:17
勢いづく米Tesla “走るスマホ”で黒字転換 先行きに不安も 
IT関連
2021-02-05 12:34
Windows 11チェックプログラムが一時削除 「正確さや詳しさが欠けていた」
製品動向
2021-06-30 15:04
さくらインターネット、那覇市にDX拠点「SAKURA innobase Okinawa」を開所
IT関連
2023-09-09 07:43
ジャック・ドーシー氏、ビットコイン開発ファンドにラッパーのJay-Zと500ビットコイン出資
企業・業界動向
2021-02-16 12:04
LayerX、「バクラク経費精算」「バクラク申請」に承認経路のシミュレーション機能
IT関連
2022-09-01 14:46
VMwareがBroadcomに買収/「PyScript」がHTML内に記述可能に/開発環境がまるごとクラウドPC化「Dev Box」発表/Flutter 3登場ほか、2022年5月の人気記事
編集後記
2022-06-03 04:41
シスコシステムズ、企業のサステナビリティー推進を多面的に支援
IT関連
2023-08-10 08:32