インテル、データセンター向けAIプロセッサー「Habana Gaudi2」発表–「IPU」ロードマップも

今回は「インテル、データセンター向けAIプロセッサー「Habana Gaudi2」発表–「IPU」ロードマップも」についてご紹介します。

関連ワード (ITインフラ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Intelは、ディープラーニング(DL)の訓練および推論向けの最新世代プロセッサー「Habana Gaudi2」「Habana Greco」を発表した。データセンターにおけるワークロードの訓練や推論のデプロイメント向けに高性能、高効率の深層学習コンピュートの選択肢を提供するとともに、どのような規模の企業にもAIの取り組みへの障壁を低減するといった狙いがある。また同社は「Intel Vision」イベントで、ビジネス顧客に向け、同社のIPU(インフラストラクチャープロセシングユニット)とGPUのポートフォリオに関する詳細を明らかにした。

 Intel傘下のHabana Labsの最高執行責任者(COO)Eitan Medina氏は、イベントに先駆け、報道陣に対して、「AIはデータセンターのけん引力になっている」と述べた上で、IntelのデータセンターチームはAIのDLプロセッサーテクノロジーに注力していると語った。「これは最も重要な応用であり、最も著しい成長を見せている。しかしさまざまな顧客が独自の応用に向け、それぞれにテクノロジーを組み合わせている」(Medina氏)

 Intelがデータセンター向けとして多様なチップに投資しているのは、ユースケースがこのように多岐にわたっているためだ。HabanaプロセッサーはDLタスクのコンピュート能力を必要としている顧客に向けたものだ。例えば、新たなGaudi2プロセッサーによって、自動運転車、医療画像、製造分野での欠陥検出で利用されるアプリケーションのビジョンモデリングを改善できるようになる。Intelは2019年、イスラエルを拠点とするプログラマブルチップメーカーのHabana Labsを約20億ドルで買収している。

 第2世代のGaudi2プロセッサー、Grecoプロセッサーはいずれも、前世代で採用していた16nmプロセスではなく7nmプロセスを採用して製造されている。またこれらのプロセッサーはHabanaの高効率アーキテクチャーを採用している。

 Intelは同日、Gaudi2と「NVIDIA A100 80GB GPU」を比較した場合、コンピュータービジョンモデルの「ResNet-50」と自然言語処理(NLP)モデル「BERT」の双方で、Gaudi2は2倍の訓練スループットを実現していると紹介した。

 Medina氏は、「同じプロセスノードとほぼ同じダイサイズで製造されているA100 GPUと比較した場合、Gaudi2は同一条件下での主要ワークロードの比較で示されているように、明らかに優れた訓練パフォーマンスを実現している」とし、「DLを高速化するこのアーキテクチャーは、根本的により効率的なものであり、盤石なロードマップに支えられている」と述べた。

 Gaudi2が実現する深層学習訓練の効率化に関するさらなる詳細は以下の通りだ。

 Gaudi2プロセッサーはHabanaの顧客向けに、既に提供が開始されている。HabanaはSupermicroとパートナーシップを組んでおり、2022年に「Supermicro Gaudi2 Training Server」を提供しようとしている。

 Greco推論プロセッサーは、2022年後半から一部の顧客に向け、サンプル提供が開始される予定だ。

 Grecoに関するさらなる詳細は以下の通り。

 IntelのエグゼクティブバイスプレジデントSandra Rivera氏は、「Gaudi2は、ますます大規模で複雑になる深層学習のワークロードを高速に効率的に訓練するよう支援できる」と述べている。

 またIntelは、IPUポートフォリオに関する2026年までのロードマップも披露した。まず、クラウド大手、GoogleやFacebookなどのハイパースケーラー向けのIPUを開発したが、現在アクセスを拡大している。

 2022年には2種類のIPUを出荷する。ASIC IPU「Mount Evans」、第2世代FPGA IPU「Oak Springs Canyon」をGoogleなどのプロバイダーに出荷する。2023/2024年には、400GBのIPU「Mount Morgan」「Hot Springs Canyon」、2025/2026年には、次世代の800GB IPUを顧客やパートナーに出荷する予定だ。

 Intelは、データセンター向けGPU(開発コード名「Arctic Sound-M/ATS-M」)の詳細も披露した。AV1ハードウェアエンコーダーを搭載する業界初のディスクリートGPUだ。ATS-Mは150兆回/秒(TOPS)の性能を想定している。2つのフォームファクターが用意され、Dell、Supermicro、Cisco、Inspur、H3C、Hewlett Packard Enterprise(HPE)などのパートナーから、15以上の搭載システムが提供される予定だ。2022年第3四半期に提供が開始される見通しだ。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
英国の郵便、「サイバーインシデント」で混乱–国外に発送できず
IT関連
2023-01-14 06:41
バイデン米大統領、プーチン露大統領に「サイバー攻撃にはサイバーで反撃する」と警告
企業・業界動向
2021-06-18 20:41
マイクロソフト、クラウド料金の異常(アノマリー)を検知する「Cost Management anomaly detection for subscriptions」パブリックプレビュー
Microsoft
2022-02-24 14:04
愛猫の消費カロリー自動算出 IoT首輪「Catlog」新機能 ”パーソニャルな食事量”の参考に
ネットトピック
2021-05-25 16:10
サイバー脅威への適切な対応を実現していくセキュリティの運用と戦略
IT関連
2023-01-11 01:10
2025年のAIインパクトを予測–外資系ITベンダー大手5社の見方から探る
IT関連
2025-01-10 21:13
「ChatGPT」を使用してコードを記述–プロンプト作成のヒントと注意点
IT関連
2023-04-29 04:08
SOMPOグループに聞く、セキュリティ脆弱性管理高度化の取り組み
IT関連
2022-05-12 11:50
インドの独占禁止監視機関がWhatsAppのプライバシーポリシー変更に対する調査を命じる
ネットサービス
2021-03-26 20:57
みずほ銀のシステム障害、基幹システムと店舗端末をつなぐシステムが故障 バックアップも機能せず 「原因は調査中」
社会とIT
2021-08-21 15:46
メタバースの台頭で真剣にとらえるべきセキュリティの課題
IT関連
2022-04-09 11:54
Box Japan、インテリジェンス分野の取り組みを加速–2025会計年度は「Box AI元年」
IT関連
2024-04-20 23:01
富士通、ブロックチェーンシステムを連携させるデータトラスト基盤の試作環境を提供
IT関連
2023-06-20 11:34
ミロ・ジャパン社長が説く「日本企業がイノベーションを起こし続けるための要件」とは
IT関連
2024-01-06 19:19