インテル、データセンター向けAIプロセッサー「Habana Gaudi2」発表–「IPU」ロードマップも

今回は「インテル、データセンター向けAIプロセッサー「Habana Gaudi2」発表–「IPU」ロードマップも」についてご紹介します。

関連ワード (ITインフラ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Intelは、ディープラーニング(DL)の訓練および推論向けの最新世代プロセッサー「Habana Gaudi2」「Habana Greco」を発表した。データセンターにおけるワークロードの訓練や推論のデプロイメント向けに高性能、高効率の深層学習コンピュートの選択肢を提供するとともに、どのような規模の企業にもAIの取り組みへの障壁を低減するといった狙いがある。また同社は「Intel Vision」イベントで、ビジネス顧客に向け、同社のIPU(インフラストラクチャープロセシングユニット)とGPUのポートフォリオに関する詳細を明らかにした。

 Intel傘下のHabana Labsの最高執行責任者(COO)Eitan Medina氏は、イベントに先駆け、報道陣に対して、「AIはデータセンターのけん引力になっている」と述べた上で、IntelのデータセンターチームはAIのDLプロセッサーテクノロジーに注力していると語った。「これは最も重要な応用であり、最も著しい成長を見せている。しかしさまざまな顧客が独自の応用に向け、それぞれにテクノロジーを組み合わせている」(Medina氏)

 Intelがデータセンター向けとして多様なチップに投資しているのは、ユースケースがこのように多岐にわたっているためだ。HabanaプロセッサーはDLタスクのコンピュート能力を必要としている顧客に向けたものだ。例えば、新たなGaudi2プロセッサーによって、自動運転車、医療画像、製造分野での欠陥検出で利用されるアプリケーションのビジョンモデリングを改善できるようになる。Intelは2019年、イスラエルを拠点とするプログラマブルチップメーカーのHabana Labsを約20億ドルで買収している。

 第2世代のGaudi2プロセッサー、Grecoプロセッサーはいずれも、前世代で採用していた16nmプロセスではなく7nmプロセスを採用して製造されている。またこれらのプロセッサーはHabanaの高効率アーキテクチャーを採用している。

 Intelは同日、Gaudi2と「NVIDIA A100 80GB GPU」を比較した場合、コンピュータービジョンモデルの「ResNet-50」と自然言語処理(NLP)モデル「BERT」の双方で、Gaudi2は2倍の訓練スループットを実現していると紹介した。

 Medina氏は、「同じプロセスノードとほぼ同じダイサイズで製造されているA100 GPUと比較した場合、Gaudi2は同一条件下での主要ワークロードの比較で示されているように、明らかに優れた訓練パフォーマンスを実現している」とし、「DLを高速化するこのアーキテクチャーは、根本的により効率的なものであり、盤石なロードマップに支えられている」と述べた。

 Gaudi2が実現する深層学習訓練の効率化に関するさらなる詳細は以下の通りだ。

 Gaudi2プロセッサーはHabanaの顧客向けに、既に提供が開始されている。HabanaはSupermicroとパートナーシップを組んでおり、2022年に「Supermicro Gaudi2 Training Server」を提供しようとしている。

 Greco推論プロセッサーは、2022年後半から一部の顧客に向け、サンプル提供が開始される予定だ。

 Grecoに関するさらなる詳細は以下の通り。

 IntelのエグゼクティブバイスプレジデントSandra Rivera氏は、「Gaudi2は、ますます大規模で複雑になる深層学習のワークロードを高速に効率的に訓練するよう支援できる」と述べている。

 またIntelは、IPUポートフォリオに関する2026年までのロードマップも披露した。まず、クラウド大手、GoogleやFacebookなどのハイパースケーラー向けのIPUを開発したが、現在アクセスを拡大している。

 2022年には2種類のIPUを出荷する。ASIC IPU「Mount Evans」、第2世代FPGA IPU「Oak Springs Canyon」をGoogleなどのプロバイダーに出荷する。2023/2024年には、400GBのIPU「Mount Morgan」「Hot Springs Canyon」、2025/2026年には、次世代の800GB IPUを顧客やパートナーに出荷する予定だ。

 Intelは、データセンター向けGPU(開発コード名「Arctic Sound-M/ATS-M」)の詳細も披露した。AV1ハードウェアエンコーダーを搭載する業界初のディスクリートGPUだ。ATS-Mは150兆回/秒(TOPS)の性能を想定している。2つのフォームファクターが用意され、Dell、Supermicro、Cisco、Inspur、H3C、Hewlett Packard Enterprise(HPE)などのパートナーから、15以上の搭載システムが提供される予定だ。2022年第3四半期に提供が開始される見通しだ。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
停電を予測、電気を作る「エネファーム」 LPWAに対応、最大500Wの電気を8日間供給
製品動向
2021-02-18 20:50
スギ薬局が進める、クーポン配信の最適化–ばらまかずに売上110%実現
IT関連
2023-09-14 04:57
Perplexity、「DeepSeek-R1」を提供–サーバーを西側に配置も検閲は残存
IT関連
2025-02-01 01:24
「Microsoft Teams」、主催者がチャットを無効にできる機能を追加
IT関連
2021-02-19 14:50
OKI、春闘で満額回答–競争力強化に向け大卒初任給を2万5000円アップ
IT関連
2023-03-17 11:34
みずほリサーチ&テクノロジーズ、メインフレームをWindows環境に移行
IT関連
2024-08-10 13:47
COMPASSとNTT Com、学習データを連携–学校現場のデータ活用を促進
IT関連
2024-05-18 09:04
被害7億円 スマートキー悪用の高級車窃盗グループ逮捕 兵庫県警
IT関連
2021-07-15 07:19
IPAの「情報セキュリティ10大脅威」2023年版–少しずつ変化する脅威の姿
IT関連
2023-03-08 02:02
AIで「実在しない男性モデルの画像」を生成 「INAI MODEL」がラインアップ拡充
ロボット・AI
2021-06-02 22:37
Metaのチーフサイエンティストが語る、機械学習の最前線(後編)
IT関連
2022-04-26 00:31
駐車場管理アプリakippeが特定利用者のみに空き駐車場を貸し出せるakippe private機能追加、3月1日スタート
IT関連
2022-02-18 16:09
終活スタートアップLanternはより良い死に方についての話し合いに火を灯す
ネットサービス
2021-01-14 09:39
常陽銀行、データ分析基盤に「VantageCloud on Azure」を採用–顧客への価値提供を向上
IT関連
2024-07-24 23:52