PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化

今回は「PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化」についてご紹介します。

関連ワード (採用、文章、高性能等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


PostgreSQLのマネージドサービスなどを提供しているTimescaleは、PostgreSQLで高速なベクトルデータベース機能を実現する拡張機能「Pgvectorcale」をオープンソースとして公開したことを発表しました。

Pgvectorcaleをオープンソースで公開

大規模言語モデルを用いた生成AIの注目度が高まる中で、文章や画像、音声といったデータの特徴を数値で表現するベクトル化(もしくはエンベディング)により、大規模言語モデルで扱えるようにすることへの注目も高まってきています。

ベクトルデータベースは、このベクトル化された膨大なデータの保存や類似度の検索などが可能です。

例えば、RAG(Retrieval Augmented Generation)と呼ばれる手法により大規模言語モデルの回答に外部のデータベースから取得したデータを組み込むことができます。こうした場面でベクトルデータベースが活用されます。

高速ベクトルデータベース化する「Pgvectorscale」

PostgreSQLには、すでにベクトル化さあれたデータを扱うための拡張機能として「Pgvector」があります。

今回オープンソースとして公開されたPgvectorscaleは、このPgvectorを補完し、さらに高性能にするために、下記の2つの改善が行われていると説明されています。

(1)マイクロソフトの研究にヒントを得て開発された、Pgvectorデータ用の高性能でコスト効率の高いベクトル検索インデックス「StreamingDiskANN」を採用。

(2)標準的な2値量子化(Binary Quantization)を基にTimescale社の研究者が改良した統計的2値量子化(SBQ:Statistical Binary Quantization)を採用。

Timescaleによると、代表的なベクトルデータベースであるPinconeと比較して、PostgreSQLにPgvectorとPgvectorscaleでは最大で28倍高速だとしています。

fig

PostgreSQLでRAGアプリを簡単に作れる「Pgai」

また同社は、PostgreSQLにエンベディングやモデル補完などのAI関連の機能をさらに組み込む拡張機能「Pgai」も合わせてオープンソースとして公開しました。

Pgaiを用いることで、PostgreSQLを使った検索とRAGアプリケーションの構築が容易になると説明されています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
株はいつ買ったら良い?–大荒れ日経平均に翻弄されない「積み立て投資術」
IT関連
2021-03-23 01:01
ストックホルムの成熟したスタートアップエコシステムについて8人の投資家に聞く(後編)
IT関連
2021-03-23 02:39
マイクロソフト、「Teams」や「Teams Rooms」向けにハイブリッドワークを支援する複数の新機能
IT関連
2021-06-18 16:47
生成AIの利用拡大で、今後6年間でハイパースケールデータセンター全体の能力が現在の約3倍に達する。Synergey Research Groupの予測
クラウド
2023-10-24 02:45
リモート会議の間違ったおきて 意見交換や交流阻害で本末転倒
IT関連
2021-03-09 12:09
ウィズセキュア、「Sphere 22」開催–コ・セキュリティの考えを推進
IT関連
2022-06-04 14:18
AIを使ってチップ製造を大幅にスピードアップするMotivoが約13億円を調達
ハードウェア
2021-08-17 03:56
SBTと龍谷大学、農業データを一元管理するデータ分析基盤を開発
IT関連
2023-04-06 15:20
「ChatGPT」がアップデート–プロンプト例表示や追加質問の提案など
IT関連
2023-08-10 02:13
GitHub Copilot Agent Modeが登場。タスクを与えると自律的にプログラミング、テストコードも修正、テストが失敗すればデバッグも
GitHub
2025-02-10 15:58
Yahoo!ショッピングやPayPayモールで「後払い決済」が可能に 2カ月後までに支払えばOK
企業・業界動向
2021-07-15 07:02
マイクロソフト、2月の月例パッチ公開–悪用された脆弱性も
IT関連
2021-02-10 02:01
DX推進を円滑化するための制度と権限の見直し–社内の古い仕組みを一掃する
IT関連
2022-12-15 12:10
音楽からダンスを自動生成するAI振付師 Googleなど開発 :Innovative Tech
トップニュース
2021-02-18 12:47