VAST DataのAI向けデータプラットフォームとは–幹部に聞く
今回は「VAST DataのAI向けデータプラットフォームとは–幹部に聞く」についてご紹介します。
関連ワード (ITインフラ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
AIが急速な進化を続ける中、AIワークロードの処理を前提としたデータプラットフォームの構築に注目が集まっている。2025年3月に開催されたNVIDIAの年次イベント「NVIDIA GTC」の基調講演でも、共同創業者で最高経営責任者(CEO)を務めるJensen Huang(ジェンスン・フアン)氏が「NVIDIA AI Data Platform」を発表。ソリューションを提供するストレージプロバイダーとして10社がアナウンスされた。
NVIDIAが「世界のストレージリーダーたち」と位置付けた10社のうち、本記事では創業の時点でAIのためのデータプラットフォームを目指していたというVAST Dataについて、取り組みの概要を紹介したい。
VAST Dataは2016年に設立。当初はステルスモードで開発を進め、2019年に製品の提供を開始したという。最初に提供されたのは「Universal Storage」で、エンタープライズ向けの分散ストレージと説明されていたが、その後2023年8月に「AI向けの完全なデータプラットフォーム」というビジョンを公式に打ち出した。ただし、これは方針転換ではなく創業当初から考えていたことであり、むしろ最初は分かりやすいステップとしてまずUniversal Storageから提供したと共同創業者でCEOのRenen Hallak(レネン・ハラック)氏は明かす。
VAST Dataは「Disaggregated, Shared-Everything」と呼ばれる分散型アーキテクチャーを採用し、多数のコンピュートノードで実行されるコンテナーベースのソフトウェア群が、不揮発性メモリーエクスプレス(NVMe)ファブリックを介して接続される多数のデータボックス(フラッシュストレージ)をコントロールする。ファブリックを介した多対多の接続で、全てのコンピュートノードが全てのデータボックスにアクセス可能な点を指して「シェアードエブリシング」と言っている。
Hallak氏は、同社のイノベーションの根幹として「AIアプリケーションが要求するスケールとパフォーマンスを実現するために、新たなメタデータ構造とアルゴリズムを開発し、SSD(ソリッドステートドライブ)の性能を引き出せるようになった」という点を挙げた。
大規模な分散型データ基盤としては「Apache Hadoop」も使われているが、同氏はHadoopの課題として「“Shared Nothing”アーキテクチャーだ」と指摘する。「Hadoopはネットワークが低速であることを前提として、ネットワークリソースをなるべく使用しないように設計されており、ノードを追加していくとパフォーマンスや信頼性が低下していく。一方、われわれは後発であるが故、より優れたテクノロジーを基盤にすることができた。高速なネットワークやNVMeファブリック、SSDやSCM(ストレージクラスメモリー)を前提とすることで、より高速で高信頼、かつ極めてコスト効率の高いシステムを実現した」という。
Hallak氏はもともとXtremIOの技術部門の責任者で、初期のフラッシュストレージの進化をけん引した経験の持ち主だ。「XtremIOではエンジニアリングの責任者として小さく高速なブロックストレージを開発したが、その後古いアーキテクチャーのままでは新しいワークロードを効率的に処理することはできないと気付いたため、退職してVAST Dataを創業した」という。
XtremIOが注目を集めた時代はフラッシュメモリーの活用の初期段階で、XtremIOはフラッシュチップをベースに独自モジュールを開発していた。こうしたハードウェアレベルの開発経験も有する同氏がVAST Dataでは既存のSSDをベースとしてソフトウェア開発に専念している理由を聞いたところ、同氏は「コモディティーのSSDを利用するのは、常に最新のハードウェアテクノロジーを活用するためだ。われわれは最新のハードウェアの能力をソフトウェアのイノベーションによって増幅する一方、独自のハードウェアを開発しようとは思わない」と語った。
多くのストレージベンダーがストレージソフトウェアの重要性を語り、その部分に競争優位があると主張する一方で独自ハードウェアの開発も行っていることが多いことに対し、同社の純ソフトウェアによるアプローチには市場に投入されるベストなハードウェアを柔軟に活用できる強みがあると言えるだろう。