「AIのためのインフラ開発」に注力–ピュア・ストレージ幹部に聞く、熱視線の先

今回は「「AIのためのインフラ開発」に注力–ピュア・ストレージ幹部に聞く、熱視線の先」についてご紹介します。

関連ワード (ITインフラ等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 米Pure StorageでAIインフラストラクチャーのバイスプレジデントを務めるPar Botes氏は、都内で開催された同社のプライベートイベント「Pure//Accelerate Tokyo 2024」の基調講演に登壇。日本のIT史の節目に携わってきた同氏に、現在Pure Storageで開発しているものや、現場のエンジニアが取り組んでいるテーマを聞いた。

 Botes氏はPure Storageがスタートアップ企業だった頃に入社し、ブレード式のフラッシュストレージ「FlashBlade」の製品開発を担当するなど、初期の成長をけん引したメンバーの一人だ。Pure Storage以前にはEMC(現Dell EMC)やVeritasなどに在籍し、これらの企業では日本のエンジニアリングチーム立ち上げに携わるなど、日本との縁も深いという。

 Oracleが買収したSun Microsystemsにも在籍していた時期もある。今では知る人ぞ知るというエピソードだろうが、スーパーコンピューターメーカーだったCrayの技術を獲得して実現したハイエンドサーバー「Sun Enterprise 10000」(通称:Starfire)は、UNIXサーバーの最上位機種としてさまざまな企業で活用され、日本ではNTTドコモのビリングシステムを支える基盤として採用された。当時Botes氏はエンジニアチームと共に来日し、Starfireの導入作業を担当したというエピソードを語ってくれた。

 自身を「生粋のソフトウェアエンジニア」と評するBotes氏は、これまでのキャリアの中でOSカーネルやストレージソフトウェアなど、さまざまなソフトウェア開発に携わってきたが、現在同氏が夢中で取り組むテーマが「AI」だ。同氏は一度Pure Storageを退職し、自動運転システムの開発に取り組むAIベンチャーに移籍したが、4年ぶりにPure Storageに復帰した。

 Botes氏はAIベンチャーに在籍した当時を振り返り、「われわれは極めて先進的なシステムを必要としていたため、コンピューティングハードウェアからネットワーク、OSカーネルやGPU対応まで、何から何まで全部自分でやった」という。自動運転車ではバッテリー消費を抑えることが重要な要件になると考えられたため、電力効率を高く保てるコンピューティングの実現に注力したそうだ。Pure Storageに復帰する際、同氏は最高経営責任者(CEO)のCharles Giancarlo氏に「AIのための新技術を開発したい」と申し出、現在に至っている。

 Botes氏は「AIベンチャーでは、“AIのためのインフラ”を全て自分で作った。当時、どこのベンダーからも買えない新しいものだったからだ。私はインフラを3世代にわたって改良し続け、より良いものに仕上げていった。この経験を踏まえ、Pure StorageではAIのためのインフラの製品化に取り組んでいる」と語った。

 同氏が考えるAIのためのインフラとは、どのようなものなのか。従来のインフラとは何が違うのか。この点については現在開発中の製品に関する話なので明かせない部分も多いだろうが、大まかなイメージを聞くことができた。

 Botes氏が考える解決すべき課題は、「適切な学習データを適切に供給できるようにすること」と表現できる。機械学習(ML)では、学習データとして何を与えるかによって最終的に得られる結果が全く違ったものになる。

 データに対するアクセス権を考慮すると、AIモデルはユーザーのアクセス権に応じてそれぞれ異なるデータを用いて結果を返すことが望ましいが、現状そうしたデータの使い分けを実現することは困難だ。同氏はソフトウェアエンジニアらしく、AIシステムをソフトウェア開発に例えて説明した。

 「AIモデルがコンパイラーで、学習データがプログラムのソースコードだとしよう。AIモデルの出力は、コンパイル済のバイナリーコードの実行結果に相当する。最終的に望み通りの結果が得られるようにするにはソースコードを改良する必要があり、いつ/どのような変更が行われたかをトレースできるバージョン管理システムが必要だ」

 ソフトウェア開発で使われるバージョン管理システムでは、ソースコードに加えられた改変の履歴を記録しており、任意のバージョンに戻ることが可能だ。同氏は、MLのために与えるデータについてもどのようなデータを使って学習させたのかを正確に把握し、コントロールできるようにする必要があると考えている。

 現状では、AIのための学習データはあまり精密に管理されておらず、学習のためのデータセットとしてまとめる際に人手で調整する形が一般的だろう。しかし、新しいインフラではデータごとに詳細なメタデータなどを付与しておき、ユーザーの権限やシステムの用途などさまざまな観点から適切なデータを選び出して学習させるようなデータ管理を実現できると思われる。

 Botes氏は「現在私が取り組んでいるテーマは、モデルを学習させるために使われたデータを完全に追跡可能にし、データが学習結果に与えた影響を検証できるようにする、そのためのインフラを作ることだ」とまとめた。

 こうしたインフラの必要性も自動運転車の開発に携わった経験から得られたもので、同氏は自動運転車の安全性を担保する上で、テストや検証のためのインフラが必須となったことを踏まえ、自動運転以外のAIにおいてもテストや検証が可能なインフラが必要だと考えるようになったという。

 このインフラがどのような形で実装されるのかについては、話を聞く限りでは同社のストレージOS「Purity」の上に実装されるAI向けのデータマネジメントレイヤーという形になるのではないかと思われる。

 Botes氏自身は「データベースでもストレージデバイスでもない、根本的に新しい別の何かだ」と説明し、具体的な情報を明かせる段階ではないようだ。使用するハードウェアプラットフォームに関しても、既存のPure Storage製品のいずれかなのか、あるいは新しいハードウェアを設計/開発するのかを含め、現時点では何も決まっていないという。

 同氏は、Sun Microsystemsに在籍していた1990年代を「素晴らしい人たちと過ごした、とても楽しい時間だった」と振り返ると同時に、現在のAIに関しては「ものすごくエキサイティングだ」と目を輝かせていた。

 長年にわたって業界の発展を見てきたトップレベルのエンジニアが夢中になって取り組んでいるテーマが現在のAIだ。大規模言語モデル(LLM)の成熟などの分かりやすい成果が次々と得られたことから既に実用段階に入った技術というイメージもあるが、実はまだ解決すべき課題が山積みで、やりがいのある面白い分野となっているようだ。

 一見するとAIとは直接関わらなさそうなストレージベンダーのPure Storageだが、同社から今後どのような成果が出てくるのか楽しみである。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
LegalForceが社名変更–契約書レビューサービスを米国で1月に開始
IT関連
2022-12-03 03:19
「設定を見直して」 NISC、「Salesforce」利用企業に注意喚起 楽天やPayPayの情報流出を受け
セキュリティ
2021-02-03 18:06
「ウォールドガーデンは崩壊した」–エリソン氏が語る、顧客を“庭の主”にするマルチクラウド
IT関連
2022-10-21 22:57
AIをテーマにいろんな発表–写真で見る「Lenovo Tech World '23」
IT関連
2023-11-01 14:27
GitHub、Secret Scanningプッシュ保護を強化–個人・組織向け機能をパブリックベータ提供
IT関連
2023-08-12 06:19
テンセントクラウドが語るWeb3の展望–生成AI関連は明言せず
IT関連
2023-03-03 16:04
グーグル、「Gemini」の大規模言語モデル(LLM)をアップデート
IT関連
2024-07-27 14:54
トーバルズ氏、「Linux 6.1」のリリースを発表–6.2の状況について報告も
IT関連
2022-12-14 10:16
アプリケーション開発における最適な手法の選び方–後編
IT関連
2023-01-19 08:17
「Linux」でグループを効率的に管理するために習得すべきコマンド5選
IT関連
2024-08-23 18:48
働き方や会議、メタバースへの従業員の意識は?–マイクロソフト調査と「Teams」新機能
IT関連
2022-03-24 18:25
C#クックブック/プログラマー脳/電子回路、マジわからん、など、ITエンジニア向け新刊案内(2023年3月)
新刊案内
2023-03-01 11:31
東京都水道局、都内26カ所にIoT流量監視装置を設置—日立システムズが支援
IT関連
2023-06-09 01:05
アップルが詐欺撲滅を目指してApp Storeガイドラインを改訂
ソフトウェア
2021-06-09 04:03