ベクトルデータベースで生成AI業界全体にアクセル–日本オラクル・三澤社長
今回は「ベクトルデータベースで生成AI業界全体にアクセル–日本オラクル・三澤社長」についてご紹介します。
関連ワード (CIO/経営、トップインタビュー等) についても参考にしながら、ぜひ本記事について議論していってくださいね。
本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。
米Oracleは9月19~21日に米国ラスベガスで年次カンファレンス「Oracle CloudWorld 2023」を開催した。20日には、日本オラクル 取締役 執行役 社長の三澤智光氏が日本の報道陣の取材に応じた。現地の所感や自社技術への自負、日本での生成AI利用拡大に向けた現実解を聞いた。
まず三澤氏は「われわれは、ホリゾンタル/バーティカルの両方でSaaSを提供しており、SaaSプロバイダーとしては最大手。『OCI(Oracle Cloud Infrastructure)』は、後発だがピリリと辛い」と独自の表現で自社を評した上で「これらにデータ/AIを組み合わせることで、医療や農業などの分野で社会貢献ができるのは感慨深い」と語った。
このことは、三澤氏の好奇心を最も刺激したという。「『AI』と言っても漠然としていた部分があったが、(今回のCloudWorldを経て)現状の課題が私の頭の中でクリアになった」と喜びを見せた。
アプリケーションの領域では、「生成AIがクラウドネイティブのSaaSをどのように進化させるか」というのが一貫したテーマだったとする。「他社が同じケイパビリティーを持とうとすると、そのモデル開発は誰がやるのかという問題がある。われわれはCohereや自社開発のLLM(大規模言語モデル)を提供していく」と同氏は語る。
気になるのはCohereが提供するLLMのレベルだが、「ベンチマークで見ると、認識率ではCohereが1位。パラメーターは500億程度だが、その中でより良い回答を出すアルゴリズムがある」と自信を見せる。
LLMの開発には膨大なコストがかかる中、数万規模のGPU、数千のインスタンスまで拡張可能なプラットフォーム「OCI Supercluster」は「倍速くて倍安い」(同氏)という。「各社が生き馬の目を抜くような競争をしている中、そのコスト削減の影響は大きいため、モデル開発をする人々は皆OCIを選択するだろう」
生成AIに伴う変化の兆しを受けて、三澤氏は「真面目にエンタープライズのアプリケーションが面白くなる」と期待を示す。「だからこそ四半期に1回、インフラストラクチャーからアップグレードされる仕組みは本当に重要。われわれが投資して作ったAIを思いっきり使ったお客さまと、そうでないお客さまの差が出てくるだろう」
三澤氏は、生成AIに対応したPaaSを提供できることに喜びをにじませる。「(CloudWorldに)参加されているお客さまやパートナー企業も驚きを見せており、ぜひPoC(概念実証)をやりたいという話をたくさん受けている」と同氏は述べる。
米Microsoftが米国時間9月14日に発表した、「Microsoft Azure」上でOracle Databaseサービスを提供する「Oracle Database@Azure」について、三澤氏は「Azureをメインのクラウドとして利用しているが、Oracle Databaseのパワーが必要なお客さまにはすごく良いサービス」と評し、その上で「われわれのベクトルデータベースが強烈」と力を込める。
OracleはCloudWorldの会期中、リレーショナルデータベース管理システムの最新版「Oracle Database 23c」に、AIベクトルを活用したセマンティック検索機能を追加する計画を発表した。これにより、文書や画像をはじめとした非構造化データのセマンティックコンテンツをベクトル形式で格納し、迅速な類似性クエリーを実行することが可能となる。
三澤氏は「当社のベクトルデータベースの仕事は2つある。1つ目は、学習データを高速にベクトル形式で保存・管理すること。データプレパレーション(データの加工・変換)は、データサイエンティストが担う全業務の約8割を占めると言われており、本当のモデル開発に割ける時間は限られている。2つ目は、自然言語による質問に回答する生成AI技術『RAG(Retrieval Augmented Generation)』にも対応しており、“マルチAI”を実現していること。CohereだけでなくOpenAIやMosaic MLなどにも使える」と述べる。
日本は生成AIの開発で遅れが懸念される中、日本オラクルが今後仕掛けていきたいアプローチを聞くと、三澤氏は「日本の企業が独自で生成AIを作ることはあまりない。GPUの買い占め競争で負けているのは事実であり、その理由は膨大なコストがかかるから。そこまで投資して何かを作ろうとするのは、日本が得意とするエリアではない」と言い切る。
「われわれがとにかくやらなければいけないのは、十分なレガシーモダナイゼーションを行い、データの整備を支援すること。データを整備できていたら、既存のLLMを活用するほか、自社のデータをベクトルデータベースに格納して利用できる。LLMは適材適所で使えばいい。そのお客さまに適したモデルを活用できるかどうかは、データの整備にかかっている。あとは当社がSaaSを普及させ、AIが勝手に組み込まれる仕組みを構築しなければならない」(同氏)
(取材協力:日本オラクル)