富士通、AI向けGPU最適化技術を発表–処理性能を最大2.25倍に向上

今回は「富士通、AI向けGPU最適化技術を発表–処理性能を最大2.25倍に向上」についてご紹介します。

関連ワード (ITインフラ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 富士通は10月22日、AIを処理するGPUの演算効率を最適化するミドルウェア「AI computing broker」を発表した。世界的なGPUの枯渇問題解決の一助としても期待され、AIサービス事業者やクラウドサービス事業者向けに提供を開始する。

 同社は、2023年11月に、高い実行効率が見込める処理に対してリアルタイムかつ優先的にGPUを割り振ることで、CPUとGPUの計算リソースを最適化する「アダプティブGPUアロケーター技術」を独自に開発している。

 今回のAI computing brokerは、アダプティブGPUアロケーター技術と各種のAI処理最適化技術を統合したものとのこと。同社によれば、複数プログラム中のGPUを必要とするAI処理部を見極め、計算リソースの割り当てや最適化を自動的に行う。従来のジョブ単位で割り当てる方法とは異なり、動的にGPUのリソースをGPUの計算単位で割り当てて稼働率を向上させるほか、GPUメモリーの管理機能もあり、ユーザーがプログラムで使用するGPUのメモリー量や、GPUの物理的なメモリー容量を気にすることなく、多数のAI処理を割り付けることが可能になるという。

 同社によれば、今回の技術はオンプレミスからクラウドまで、また、単一GPUで使用するAIアプリケーションから複数のGPUを用いる大規模言語モデル(LLM)開発まで幅広く適用できるとする。

 富士通は、2024年5月にトレーダム、さくらインターネット、AWL、エクストリーム-D、モルゲンロットと共同で、単一のGPUを用いた同技術を試行。同技術の非適用時に比べて、GPUの単位時間当たりの処理性能が最大2.25倍に向上する効果を確認したという。また、上述のメモリー管理機能に関しては、最大でGPUの物理メモリー容量の約5倍に相当する150GBメモリーを必要とするAI処理でも同時に取り扱えることを確認したとしている。

 この試行の結果を踏まえて、トレーダムが10月から同技術を採用し、さくらインターネットが富士通と共同で複数のGPUに同技術を適用する実証実験を開始する。富士通は今後、さらに大規模な環境での利用を想定した同技術の適用など、適用範囲を拡張させていくという。

 GPUは、世界的なAI/生成AIの処理需要の高まりを受けて世界的に枯渇しており、今後も供給のひっ迫が見込まれる。富士通は、今回の技術の活用で、AI処理における既存GPUの演算効率の向上とGPUコストの削減、あるいは1つのGPUにできるだけ多くのAI処理を割り当てることが可能になり、AIサービス事業者やクラウドサービス事業者のGPUの運用、世界的なGPUの不足や増大する電力消費などの問題の改善に一助になるとしている。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
AIチャットへの質問、1割近くが「性的な内容」–安全なAIを目指す研究者らの取り組み
IT関連
2023-10-12 09:03
「複雑性はわれわれが引き受ける」–Snowflake製品担当幹部が語る事業戦略
IT関連
2023-02-19 07:49
世界初のGUI搭載パソコン「Apple Lisa」のソースコードが公開–発売40周年で
IT関連
2023-01-25 22:21
多様なデータで人事異動を最適化–人事労務ソフト「SmartHR」に新機能
IT関連
2023-02-09 08:34
グーグルも注力、クラウドシフトを起点にITの「内製化」は進むか
IT関連
2022-11-08 22:35
DNP、AIで新店舗の宣伝予算配分を最適化するサービスを開発–ローソンで導入
IT関連
2024-10-18 10:31
AWS、セキュリティ問題を分析する「Amazon Detective」がAmazon EKSのKubernetesワークロードに対応
AWS
2022-08-02 21:44
アマゾン、「Fire TV Cube」を企業向けのシンクライアントに
IT関連
2023-11-29 23:31
「ChatGPT」はバグ修正も得意–開発者の負担が軽減されるかは不明
IT関連
2023-02-04 19:25
契約書レビュー支援「GVA assist」、レビュー結果ダウンロード機能にオプション条文を追加
IT関連
2024-04-09 00:28
エヌビディア、生成AI向けプラットフォームを発表
IT関連
2023-03-23 07:55
日立系技術商社の瑞穂、ランサムウェア対策でイミュータブルストレージを導入
IT関連
2024-01-13 09:42
AI悪用の誤情報が今後2年で最大の世界的リスクに–WEF
IT関連
2024-01-21 22:27
GoogleからAppleへAI人材移籍再び AI部門の研究マネジャーだったサミー・ベンジオ氏がAppleに転職
ロボット・AI
2021-05-07 18:00