PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化

今回は「PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化」についてご紹介します。

関連ワード (採用、文章、高性能等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


PostgreSQLのマネージドサービスなどを提供しているTimescaleは、PostgreSQLで高速なベクトルデータベース機能を実現する拡張機能「Pgvectorcale」をオープンソースとして公開したことを発表しました。

Pgvectorcaleをオープンソースで公開

大規模言語モデルを用いた生成AIの注目度が高まる中で、文章や画像、音声といったデータの特徴を数値で表現するベクトル化(もしくはエンベディング)により、大規模言語モデルで扱えるようにすることへの注目も高まってきています。

ベクトルデータベースは、このベクトル化された膨大なデータの保存や類似度の検索などが可能です。

例えば、RAG(Retrieval Augmented Generation)と呼ばれる手法により大規模言語モデルの回答に外部のデータベースから取得したデータを組み込むことができます。こうした場面でベクトルデータベースが活用されます。

高速ベクトルデータベース化する「Pgvectorscale」

PostgreSQLには、すでにベクトル化さあれたデータを扱うための拡張機能として「Pgvector」があります。

今回オープンソースとして公開されたPgvectorscaleは、このPgvectorを補完し、さらに高性能にするために、下記の2つの改善が行われていると説明されています。

(1)マイクロソフトの研究にヒントを得て開発された、Pgvectorデータ用の高性能でコスト効率の高いベクトル検索インデックス「StreamingDiskANN」を採用。

(2)標準的な2値量子化(Binary Quantization)を基にTimescale社の研究者が改良した統計的2値量子化(SBQ:Statistical Binary Quantization)を採用。

Timescaleによると、代表的なベクトルデータベースであるPinconeと比較して、PostgreSQLにPgvectorとPgvectorscaleでは最大で28倍高速だとしています。

fig

PostgreSQLでRAGアプリを簡単に作れる「Pgai」

また同社は、PostgreSQLにエンベディングやモデル補完などのAI関連の機能をさらに組み込む拡張機能「Pgai」も合わせてオープンソースとして公開しました。

Pgaiを用いることで、PostgreSQLを使った検索とRAGアプリケーションの構築が容易になると説明されています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
国内データセンター延床面積は年6.7%増加見込み– IDC Japan
IT関連
2021-05-13 00:26
今週の記事ランキング(2021.4.18〜4.22)
IT関連
2021-04-24 02:44
大鵬薬品、ウェブ会議ソリューションを導入–準備にかかる手間を軽減
IT関連
2022-08-06 23:55
「ChatGPT Plus」のウェブブラウジング機能、いったん停止に
IT関連
2023-07-06 05:00
Square、143%増収 Cash Appのビットコイン収益は200%増
企業・業界動向
2021-08-03 06:31
「Apple Intelligence」登場–OSに統合されたアップル製AIの多様な機能
IT関連
2024-06-15 04:50
挑むのは“DX課題の最先端”–電通デジタル、トランスフォーメーション事業を解説
IT関連
2023-07-28 21:37
GMO、役員報酬1億円超が11人に うち3人が2億円超
キャリア・しごと
2021-05-15 13:28
旭化成と奈良県立医大が「226nm UVC LED」紫外光照射による新型コロナウイルス不活化を確認、動物細胞への影響も検証
ハードウェア
2021-06-15 13:37
ASUS、スタイラス付きで1キロ以下のChromebook「Detachable CM3」の動画公開
製品動向
2021-03-10 08:59
韓国NAVER Zがメタバースクリエイター向けの約115億円ファンドを設立
IT関連
2022-01-29 15:13
資生堂、従業員エクスペリエンス管理ツールをグローバル全域で導入
IT関連
2022-06-04 18:10
セブン-イレブンがTwitterキャンペーン取り下げで謝罪 過大な権限要求は「設定ミスだった」
企業・業界動向
2021-07-16 13:32
富士通とカーネギーメロン大、ソーシャルデジタルツインを共同研究
IT関連
2022-02-11 08:03