PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化

今回は「PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化」についてご紹介します。

関連ワード (採用、文章、高性能等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


PostgreSQLのマネージドサービスなどを提供しているTimescaleは、PostgreSQLで高速なベクトルデータベース機能を実現する拡張機能「Pgvectorcale」をオープンソースとして公開したことを発表しました。

Pgvectorcaleをオープンソースで公開

大規模言語モデルを用いた生成AIの注目度が高まる中で、文章や画像、音声といったデータの特徴を数値で表現するベクトル化(もしくはエンベディング)により、大規模言語モデルで扱えるようにすることへの注目も高まってきています。

ベクトルデータベースは、このベクトル化された膨大なデータの保存や類似度の検索などが可能です。

例えば、RAG(Retrieval Augmented Generation)と呼ばれる手法により大規模言語モデルの回答に外部のデータベースから取得したデータを組み込むことができます。こうした場面でベクトルデータベースが活用されます。

高速ベクトルデータベース化する「Pgvectorscale」

PostgreSQLには、すでにベクトル化さあれたデータを扱うための拡張機能として「Pgvector」があります。

今回オープンソースとして公開されたPgvectorscaleは、このPgvectorを補完し、さらに高性能にするために、下記の2つの改善が行われていると説明されています。

(1)マイクロソフトの研究にヒントを得て開発された、Pgvectorデータ用の高性能でコスト効率の高いベクトル検索インデックス「StreamingDiskANN」を採用。

(2)標準的な2値量子化(Binary Quantization)を基にTimescale社の研究者が改良した統計的2値量子化(SBQ:Statistical Binary Quantization)を採用。

Timescaleによると、代表的なベクトルデータベースであるPinconeと比較して、PostgreSQLにPgvectorとPgvectorscaleでは最大で28倍高速だとしています。

fig

PostgreSQLでRAGアプリを簡単に作れる「Pgai」

また同社は、PostgreSQLにエンベディングやモデル補完などのAI関連の機能をさらに組み込む拡張機能「Pgai」も合わせてオープンソースとして公開しました。

Pgaiを用いることで、PostgreSQLを使った検索とRAGアプリケーションの構築が容易になると説明されています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
WebAssembly/WASIに対応した「Ruby 3.2 Preview 1」公開。WebブラウザでRubyが動く世界がやってくる
Ruby
2022-04-13 20:57
ヤフー、米国側とのライセンス契約終了へ ロイヤリティーなしで「Yahoo!」ブランド利用可能に
企業・業界動向
2021-07-06 00:17
企業の課題を解決する、AI活用支援サービスとは
PR
2021-03-17 22:24
パスワードレスの世界に一歩前進–LastPass、パスキー機能のベータ版提供
IT関連
2024-11-15 09:46
凸版印刷、アバターの真正性を証明する管理基盤開発–なりすまし抑止へ
IT関連
2022-02-26 16:18
保険金詐欺と戦うAIを開発するShift Technologyが1090億円を超える評価で240億円調達
人工知能・AI
2021-05-09 09:45
英政府、Appleを独禁法違反の疑いで調査開始 アプリストアの開発者向け規約で
企業・業界動向
2021-03-06 06:28
BPM実践ガイド:段階的モデリングで推進する業務改革
IT関連
2024-09-14 16:33
スタートアップがLiDARの先に見ている自動運転車両の知覚システム
モビリティ
2021-03-01 10:44
AWS、シンクライアント専用デバイス「Amazon WorkSpaces Thin Client」発表
AWS
2023-11-28 02:07
「エンタープライズの5Gは始まったばかり」–エリクソンの野崎社長
IT関連
2023-02-23 05:49
NFT化したご当地キャラと写真撮影–CTCと直方市、ふるさと納税の返礼品で実証実験
IT関連
2023-02-17 02:04
LINE、コロナワクチンの接種予約システムを開発 自治体に提供
ロボット・AI
2021-01-29 03:54
ADKグループ、全社員に「Azure OpenAI Service」活用のボット公開–プランニングへの活用など図る
IT関連
2023-06-14 01:55