ピュア・ストレージ、AI/HPC向けの新ストレージアーキテクチャーを発表
今回は「ピュア・ストレージ、AI/HPC向けの新ストレージアーキテクチャーを発表」についてご紹介します。
関連ワード (ITインフラ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
ピュア・ストレージ・ジャパンは3月12日、AI/ハイパフォーマンスコンピューティング(HPC)向けのデータストレージプラットフォームの新製品として「FlashBlade//EXA」を発表した。「AI/HPCワークロードに求められる高度な並列処理と膨大なメタデータ処理」に対応するため、データとメタデータを分離することで、AIで使われる膨大なメタデータによって引き起こされていたボトルネックを解消するという。
FlashBlade//EXAの提供開始は2025年夏頃とされているが、6月中旬には同社の年次イベント「Pure//Accelerate 2025」が開催予定のため、そこで提供開始が発表されると予想される。
FlashBlade//EXAについて説明した米Pure Storageで最高技術責任者(CTO) 兼 アジア太平洋・日本地域担当(APJ)バイスプレジデント(VP)を務めるMatt Oostveen(マット・ウーストヴィーン)氏は急速に盛り上がっているAI関連技術に関して、高価なリソースであるGPUの利用率が低いことを課題として挙げ、「われわれの調査では、GPUの利用率は典型的には10%にも満たない」と指摘した。
その原因として、同氏は「メタデータのボトルネック」を挙げた。AI分野におけるメタデータの使われ方として、Oostveen氏は「自動運転のような用途を考えた場合、膨大な量の動画データに対して、注目すべきポイントなどを指示するためのメタデータが独立した小サイズのファイルとして多数関連付けられる形になる」と説明した。
巨大なファイルの内容を一気に読み出すのは速度を稼ぎやすいが、小さなファイルを多数次々にアクセスしていくのはオーバーヘッドが大きくなりがちなので、それぞれの全く異なるアクセスパターンに対して適切に最適化することで全体のパフォーマンスを向上できるというのが、FlashBlade//EXAの基本的なアイデアである。
FlashBlade//EXAではメタデータをメタデータノードに、データをデータノードに格納することでそれぞれを独立して拡張可能とし、ラック辺りのI/O帯域幅は3.4TB/sに達するという(図1)。単一のネームスペースでエクサバイトクラスまで拡張可能だといい、例えば3ラックで単一ネームスペース構成とした場合、読み取り性能で10TB/s以上の性能が達成できるという。
一般向けに製品提供が開始されるのは前述の通り夏頃の予定となっており、詳細な情報はその際に公表されると思われるが、大規模なAI向けインフラを構築するユーザーにとっては注目すべき新製品といえるだろう。なお、今回の発表は米NVIDIAの年次イベント「GTC」に合わせて実施されたもので、Pure StorageとNVIDIAはAI向けインフラの分野で密接なパートナーシップを構築している。
FlashBlade//EXAの特徴として、Oostveen氏は性能の高さに加えて拡張性の高さや独自のフラッシュモジュール(DFM)による高密度実装やコストパフォーマンスの高さを強調すると同時に、NVIDIAとは既に検証作業を進めており、今後同社の認定を取得する予定だという。