PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化

今回は「PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化」についてご紹介します。

関連ワード (採用、文章、高性能等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


PostgreSQLのマネージドサービスなどを提供しているTimescaleは、PostgreSQLで高速なベクトルデータベース機能を実現する拡張機能「Pgvectorcale」をオープンソースとして公開したことを発表しました。

Pgvectorcaleをオープンソースで公開

大規模言語モデルを用いた生成AIの注目度が高まる中で、文章や画像、音声といったデータの特徴を数値で表現するベクトル化(もしくはエンベディング)により、大規模言語モデルで扱えるようにすることへの注目も高まってきています。

ベクトルデータベースは、このベクトル化された膨大なデータの保存や類似度の検索などが可能です。

例えば、RAG(Retrieval Augmented Generation)と呼ばれる手法により大規模言語モデルの回答に外部のデータベースから取得したデータを組み込むことができます。こうした場面でベクトルデータベースが活用されます。

高速ベクトルデータベース化する「Pgvectorscale」

PostgreSQLには、すでにベクトル化さあれたデータを扱うための拡張機能として「Pgvector」があります。

今回オープンソースとして公開されたPgvectorscaleは、このPgvectorを補完し、さらに高性能にするために、下記の2つの改善が行われていると説明されています。

(1)マイクロソフトの研究にヒントを得て開発された、Pgvectorデータ用の高性能でコスト効率の高いベクトル検索インデックス「StreamingDiskANN」を採用。

(2)標準的な2値量子化(Binary Quantization)を基にTimescale社の研究者が改良した統計的2値量子化(SBQ:Statistical Binary Quantization)を採用。

Timescaleによると、代表的なベクトルデータベースであるPinconeと比較して、PostgreSQLにPgvectorとPgvectorscaleでは最大で28倍高速だとしています。

fig

PostgreSQLでRAGアプリを簡単に作れる「Pgai」

また同社は、PostgreSQLにエンベディングやモデル補完などのAI関連の機能をさらに組み込む拡張機能「Pgai」も合わせてオープンソースとして公開しました。

Pgaiを用いることで、PostgreSQLを使った検索とRAGアプリケーションの構築が容易になると説明されています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
「スカパー!」アクセス集中でルヴァンカップ見られず 視聴料を返金
くらテク
2021-05-09 22:47
次のLTS版となる「Node.js 22」正式リリース。WebAssembly GCがデフォルトで利用可能に
JavaScript
2024-05-01 19:57
コロナ禍で離れた客を”SNS映え”で取り戻す? まるでアートな「オトナの水族館」
IT関連
2021-06-18 17:08
拡大する企業変革の要請に結果まで応える–アビームの山田社長
IT関連
2023-06-01 09:03
Herokuが次世代プラットフォーム「Fir」発表。OCIコンテナ、Kubernetes、OpenTelemetryなど業界標準の組み合わせで構築
Docker
2024-12-10 21:50
JR東など5社、新幹線での公衆電話サービスを終了 全区間の通信エリア化受け
企業・業界動向
2021-03-19 07:52
「Chrome」、タブ管理に役立つ3つの新機能が追加へ
IT関連
2024-09-12 02:03
オフィス空調をAIで一括管理 消費電力を約半分に 東京建物など3社が実験
クラウドユーザー
2021-01-20 05:41
「SQLite3 WASM/JS」パブリックベータ公開。SQLite 3.40でサポート開始、WebブラウザなどでSQLiteが実行可能に
RDB
2022-11-21 16:45
凸版、インターナルカーボンプライシング制度導入へ–CO2排出量をコスト換算
IT関連
2023-03-07 00:21
アマゾン、5月から週3日以上の出社を義務付けへ
IT関連
2023-02-21 19:33
2020年の米大統領選、ロシアやイランが工作–米情報機関が報告
IT関連
2021-03-18 18:47
「ギルド」からオープンソースまで–Bloombergのイノベーションを支えるエンジニアリング
IT関連
2022-02-18 14:17
トヨタファイナンス、AI対話エンジンの導入で顧客体験の向上を目指す
IT関連
2022-08-13 04:09