PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化

今回は「PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化」についてご紹介します。

関連ワード (採用、文章、高性能等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


PostgreSQLのマネージドサービスなどを提供しているTimescaleは、PostgreSQLで高速なベクトルデータベース機能を実現する拡張機能「Pgvectorcale」をオープンソースとして公開したことを発表しました。

Pgvectorcaleをオープンソースで公開

大規模言語モデルを用いた生成AIの注目度が高まる中で、文章や画像、音声といったデータの特徴を数値で表現するベクトル化(もしくはエンベディング)により、大規模言語モデルで扱えるようにすることへの注目も高まってきています。

ベクトルデータベースは、このベクトル化された膨大なデータの保存や類似度の検索などが可能です。

例えば、RAG(Retrieval Augmented Generation)と呼ばれる手法により大規模言語モデルの回答に外部のデータベースから取得したデータを組み込むことができます。こうした場面でベクトルデータベースが活用されます。

高速ベクトルデータベース化する「Pgvectorscale」

PostgreSQLには、すでにベクトル化さあれたデータを扱うための拡張機能として「Pgvector」があります。

今回オープンソースとして公開されたPgvectorscaleは、このPgvectorを補完し、さらに高性能にするために、下記の2つの改善が行われていると説明されています。

(1)マイクロソフトの研究にヒントを得て開発された、Pgvectorデータ用の高性能でコスト効率の高いベクトル検索インデックス「StreamingDiskANN」を採用。

(2)標準的な2値量子化(Binary Quantization)を基にTimescale社の研究者が改良した統計的2値量子化(SBQ:Statistical Binary Quantization)を採用。

Timescaleによると、代表的なベクトルデータベースであるPinconeと比較して、PostgreSQLにPgvectorとPgvectorscaleでは最大で28倍高速だとしています。

fig

PostgreSQLでRAGアプリを簡単に作れる「Pgai」

また同社は、PostgreSQLにエンベディングやモデル補完などのAI関連の機能をさらに組み込む拡張機能「Pgai」も合わせてオープンソースとして公開しました。

Pgaiを用いることで、PostgreSQLを使った検索とRAGアプリケーションの構築が容易になると説明されています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
増えるフィッシング攻撃、その被害は高額に–バラクーダ調査
IT関連
2023-02-14 11:34
NEC、自動販売機で顔認証決済ができる新サービスを発表
IT関連
2023-04-26 01:45
日本メクトロン、クラウドを使って販売管理データ統合基盤を自社構築
IT関連
2023-03-01 05:37
Opera、LLMをダウンロードしてローカルで利用する機能を開発者版で提供
IT関連
2024-04-05 14:10
YouTubeが一部クリエイターを対象にライブストリームからのショッピングを試験的に開始
ネットサービス
2021-07-23 01:48
遅くとも2年以内には国内シェアもトップに–ヴィーム・ソフトウェア
IT関連
2024-02-10 03:54
「Amazon S3より80%安い」– Wasabi Technologies、APAC地域の本社を日本に設立
IT関連
2021-06-25 01:48
【コラム】プログラマティック広告における広告詐欺と消費者プライバシー乱用との戦い方
ネットサービス
2021-07-09 22:32
アライドテレシスと大津赤十字病院、自動オフラインバックアップによるランサムウェア対策を検証
IT関連
2023-07-06 15:20
FireEye、SolarWindsインシデントの詳細を公開–対策ツールも提供
IT関連
2021-01-20 23:33
a16zによる次の気候テック投資がカーボンオフセットAPIのPatchになる可能性
EnviroTech
2021-02-08 14:56
PC運用のDX–Device as a Serviceを使う目的は、つまり何か?
IT関連
2022-03-17 14:08
農地をスキャンし、壁を作り、窓を掃除するロボットたち
IT関連
2022-03-26 05:44
社外をどう説得したのか–契約業務をデジタル化したドリコムの秘策
IT関連
2021-03-16 13:36