インテル、データセンター向けAIプロセッサー「Habana Gaudi2」発表–「IPU」ロードマップも

今回は「インテル、データセンター向けAIプロセッサー「Habana Gaudi2」発表–「IPU」ロードマップも」についてご紹介します。

関連ワード (ITインフラ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Intelは、ディープラーニング(DL)の訓練および推論向けの最新世代プロセッサー「Habana Gaudi2」「Habana Greco」を発表した。データセンターにおけるワークロードの訓練や推論のデプロイメント向けに高性能、高効率の深層学習コンピュートの選択肢を提供するとともに、どのような規模の企業にもAIの取り組みへの障壁を低減するといった狙いがある。また同社は「Intel Vision」イベントで、ビジネス顧客に向け、同社のIPU(インフラストラクチャープロセシングユニット)とGPUのポートフォリオに関する詳細を明らかにした。

 Intel傘下のHabana Labsの最高執行責任者(COO)Eitan Medina氏は、イベントに先駆け、報道陣に対して、「AIはデータセンターのけん引力になっている」と述べた上で、IntelのデータセンターチームはAIのDLプロセッサーテクノロジーに注力していると語った。「これは最も重要な応用であり、最も著しい成長を見せている。しかしさまざまな顧客が独自の応用に向け、それぞれにテクノロジーを組み合わせている」(Medina氏)

 Intelがデータセンター向けとして多様なチップに投資しているのは、ユースケースがこのように多岐にわたっているためだ。HabanaプロセッサーはDLタスクのコンピュート能力を必要としている顧客に向けたものだ。例えば、新たなGaudi2プロセッサーによって、自動運転車、医療画像、製造分野での欠陥検出で利用されるアプリケーションのビジョンモデリングを改善できるようになる。Intelは2019年、イスラエルを拠点とするプログラマブルチップメーカーのHabana Labsを約20億ドルで買収している。

 第2世代のGaudi2プロセッサー、Grecoプロセッサーはいずれも、前世代で採用していた16nmプロセスではなく7nmプロセスを採用して製造されている。またこれらのプロセッサーはHabanaの高効率アーキテクチャーを採用している。

 Intelは同日、Gaudi2と「NVIDIA A100 80GB GPU」を比較した場合、コンピュータービジョンモデルの「ResNet-50」と自然言語処理(NLP)モデル「BERT」の双方で、Gaudi2は2倍の訓練スループットを実現していると紹介した。

 Medina氏は、「同じプロセスノードとほぼ同じダイサイズで製造されているA100 GPUと比較した場合、Gaudi2は同一条件下での主要ワークロードの比較で示されているように、明らかに優れた訓練パフォーマンスを実現している」とし、「DLを高速化するこのアーキテクチャーは、根本的により効率的なものであり、盤石なロードマップに支えられている」と述べた。

 Gaudi2が実現する深層学習訓練の効率化に関するさらなる詳細は以下の通りだ。

 Gaudi2プロセッサーはHabanaの顧客向けに、既に提供が開始されている。HabanaはSupermicroとパートナーシップを組んでおり、2022年に「Supermicro Gaudi2 Training Server」を提供しようとしている。

 Greco推論プロセッサーは、2022年後半から一部の顧客に向け、サンプル提供が開始される予定だ。

 Grecoに関するさらなる詳細は以下の通り。

 IntelのエグゼクティブバイスプレジデントSandra Rivera氏は、「Gaudi2は、ますます大規模で複雑になる深層学習のワークロードを高速に効率的に訓練するよう支援できる」と述べている。

 またIntelは、IPUポートフォリオに関する2026年までのロードマップも披露した。まず、クラウド大手、GoogleやFacebookなどのハイパースケーラー向けのIPUを開発したが、現在アクセスを拡大している。

 2022年には2種類のIPUを出荷する。ASIC IPU「Mount Evans」、第2世代FPGA IPU「Oak Springs Canyon」をGoogleなどのプロバイダーに出荷する。2023/2024年には、400GBのIPU「Mount Morgan」「Hot Springs Canyon」、2025/2026年には、次世代の800GB IPUを顧客やパートナーに出荷する予定だ。

 Intelは、データセンター向けGPU(開発コード名「Arctic Sound-M/ATS-M」)の詳細も披露した。AV1ハードウェアエンコーダーを搭載する業界初のディスクリートGPUだ。ATS-Mは150兆回/秒(TOPS)の性能を想定している。2つのフォームファクターが用意され、Dell、Supermicro、Cisco、Inspur、H3C、Hewlett Packard Enterprise(HPE)などのパートナーから、15以上の搭載システムが提供される予定だ。2022年第3四半期に提供が開始される見通しだ。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
石川県加賀市が日本初のe-Residency(電子市民)プログラム「e-加賀市民制度」を提供へ
GovTech
2021-05-16 09:29
Facebook、AIに「忘れさせる」手法を開発–重要な情報に集中して効率化
IT関連
2021-05-17 23:41
P&G、宇宙での洗濯を可能にする洗剤開発でNASAと提携
企業・業界動向
2021-06-24 06:20
日本MSと立命館、連携協定を締結–産学連携で学生の多様な挑戦を後押し
IT関連
2023-08-05 05:58
知的財産保護の専門家が著作権法を基に整理する、生成AIの扱い方–日本弁理士会
IT関連
2023-08-08 17:55
カプコン情報流出、いまだ被害確定できず 20年4〜12月期決算は最高益
IT関連
2021-02-02 01:46
バンダイナムコHD、「Sansan」をグループ43社に導入
IT関連
2023-03-16 00:20
「プロセスマイニングを再発明する」Celonis、プロセス管理実行基盤に新機能
IT関連
2022-12-23 13:03
中小企業にクレジットカードを提供する支出管理プラットフォーム「Moss」が約97.8億円調達
IT関連
2022-01-24 06:24
西武鉄道、3D画像センサーで踏切異常を高精度に検知–踏切事故を未然に防止
IT関連
2022-11-12 01:06
第一生命、タレントマネジメントシステムを導入–社員のポテンシャル発揮図る
IT関連
2023-06-01 02:46
NEC、顔認証ソフトとクラウドサービスの最新版を発表–運用管理を改善
IT関連
2023-03-30 09:19
アマゾンの第1四半期、AWSの売上高が32%増
IT関連
2021-04-30 10:00
ついに登場した「iPhone 14 Pro/Pro Max」–変更点や新機能を写真で確認
IT関連
2022-09-18 16:28