オラクル、「HeatWave GenAI」の提供を開始–追加コストなしで生成AIアプリを構築可能に

今回は「オラクル、「HeatWave GenAI」の提供を開始–追加コストなしで生成AIアプリを構築可能に」についてご紹介します。

関連ワード (データマネジメント等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、ZDNet Japan様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


 Oracleは米国時間6月26日、「HeatWave GenAI」の提供を開始すると発表した。「インデータベース大規模言語モデル(LLM)」「自動化されたインデータベースベクトルストア」「スケールアウト可能なベクトル処理」「HeatWave Chat」といった機能を備える。

 「HeatWave」は、オンライントランザクション処理(OLTP)やオンライン分析処理(OLAP)、機械学習、レイクハウスなどを提供するフルマネージド型データベースサービス。HeatWaveのユーザーは、HeatWave GenAIを追加費用なしで利用できる。

 インデータベースLLMは、低コストで生成AIアプリケーションの開発を簡素化する。ユーザーは、HeatWaveのベクトルストアでデータを検索し、コンテンツを生成・要約し、検索拡張生成(RAG)を実行できる。生成AIを「AutoML」などのHeatWaveの他の組み込み機能と組み合わせることで、よりリッチなアプリケーションの構築も可能という。「OCI Generative AI」サービスとも連携しており、主要なLLMプロバイダーの事前トレーニング済みの基盤モデルを利用することもできる。

 HeatWave GenAIでは、ベクトルストアとベクトルの埋め込みを作成する全てのステップが自動化されている。また、オブジェクトストレージ内のドキュメントの検出、解析、埋め込み生成、ベクトルストアへの挿入などの処理がデータベース内で実行される。RAGにベクトルストアを使用することで、モデルが適切なコンテキストで独自のデータを検索し、より正確で関連性の高い回答を提供できるようになる。

 ベクトル処理はスケールアウトさせることで、非常に高速なセマンティック検索が可能という。さらに、HeatWaveで新しいネイティブのVECTORデータ型と最適化された距離関数の実装をサポートした。HeatWaveのインメモリーハイブリッドカラムナー表現とスケールアウトアーキテクチャーにより、ベクトル処理はメモリーに近い帯域幅で実行され、最大512のHeatWaveノード間で並列化される。セマンティック検索を他のSQL演算子と組み合わせることで、異なるドキュメントを持つ複数のテーブルを結合し、全てのドキュメントで類似検索を実行できるという。

 HeatWave Chatは、「MySQL Shell」用の「Visual Code」プラグインになる。HeatWave GenAIのグラフィカルインターフェースを提供し、開発者は自然言語やSQLで質問ができる。また、「Lakehouse Navigator」を用いてデータベース全体の検索やフォルダーに限定した検索ができる。質問の履歴やソース文書の引用、LLMへのプロンプトなどのコンテキストはHeatWave内に維持され、コンテキストに基づいた会話や生成された回答の出典確認が可能である。

 HeatWave GenAIのベンチマーク結果も明らかにされており、PDF、PPT、WORD、HTML形式のドキュメントのベクトルストアの作成は、「Amazon Bedrock」のKnowledge baseを使用する場合と比較して、HeatWave GenAIを使用すると最大23倍速く、コストは4分の1になるとしている。さらに、HeatWave GenAIは「Snowflake」より30倍高速でコストは25%削減され、「Databricks」より15倍高速でコストは85%削減され、「Google BigQuery」より18倍高速でコストは60%削減されるとのこと。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
離婚した両親の金銭トラブルを回避するアプリのEnsembleが3.3億円調達
ソフトウェア
2021-04-02 18:27
PwCコンサルティング、非財務情報を一元管理する仕組みを提供–適切な状況把握や情報開示に対応
IT関連
2023-11-28 06:47
第1回:本格化するDXビジネスでIT部門は活躍しているのか?
IT関連
2022-05-26 09:57
「ChatGPT」を使用してコードを記述–プロンプト作成のヒントと注意点
IT関連
2023-04-29 04:08
暗号資産、一時660億円流出も4割返還 攻撃者は送金権限を改ざんか
セキュリティ
2021-08-13 17:23
富士通の研究戦略はこれまでと何が変わり何が変わらないのか
IT関連
2023-10-20 03:55
日本HPの新製品発表会見で感じた「AI PCの大いなるポテンシャル」
IT関連
2024-10-11 18:07
TikTokが開発者向け新ツールの提供開始、サードパーティーアプリの統合を拡大
ネットサービス
2021-05-10 04:35
運転席に誰も乗っていないテスラ車が事故を起こし後部座席と助手席の2名が死亡
モビリティ
2021-04-21 02:03
Denodo、2024年の重要施策やパートナー戦略を発表
IT関連
2024-02-01 17:58
レコチョクがWeb3時代を見据えブロックチェーン活用ビジネスに参入、NFT発行・販売や音楽業界にDAO提案
IT関連
2022-01-19 19:47
ペプチド医薬品開発を手がける宮崎大学発「ひむかAMファーマ」が総額6億円超のシリーズB調達、創薬開発を進展
IT関連
2022-01-18 12:17
「Linux」でデバイスの円滑な動作を維持するために知っておくべきコマンド5選
IT関連
2024-05-03 03:45
富士通ら、データセンターの安定稼働と運用自動化に向けて実証へ
IT関連
2022-11-09 11:12