PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化

今回は「PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化」についてご紹介します。

関連ワード (採用、文章、高性能等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


PostgreSQLのマネージドサービスなどを提供しているTimescaleは、PostgreSQLで高速なベクトルデータベース機能を実現する拡張機能「Pgvectorcale」をオープンソースとして公開したことを発表しました。

Pgvectorcaleをオープンソースで公開

大規模言語モデルを用いた生成AIの注目度が高まる中で、文章や画像、音声といったデータの特徴を数値で表現するベクトル化(もしくはエンベディング)により、大規模言語モデルで扱えるようにすることへの注目も高まってきています。

ベクトルデータベースは、このベクトル化された膨大なデータの保存や類似度の検索などが可能です。

例えば、RAG(Retrieval Augmented Generation)と呼ばれる手法により大規模言語モデルの回答に外部のデータベースから取得したデータを組み込むことができます。こうした場面でベクトルデータベースが活用されます。

高速ベクトルデータベース化する「Pgvectorscale」

PostgreSQLには、すでにベクトル化さあれたデータを扱うための拡張機能として「Pgvector」があります。

今回オープンソースとして公開されたPgvectorscaleは、このPgvectorを補完し、さらに高性能にするために、下記の2つの改善が行われていると説明されています。

(1)マイクロソフトの研究にヒントを得て開発された、Pgvectorデータ用の高性能でコスト効率の高いベクトル検索インデックス「StreamingDiskANN」を採用。

(2)標準的な2値量子化(Binary Quantization)を基にTimescale社の研究者が改良した統計的2値量子化(SBQ:Statistical Binary Quantization)を採用。

Timescaleによると、代表的なベクトルデータベースであるPinconeと比較して、PostgreSQLにPgvectorとPgvectorscaleでは最大で28倍高速だとしています。

fig

PostgreSQLでRAGアプリを簡単に作れる「Pgai」

また同社は、PostgreSQLにエンベディングやモデル補完などのAI関連の機能をさらに組み込む拡張機能「Pgai」も合わせてオープンソースとして公開しました。

Pgaiを用いることで、PostgreSQLを使った検索とRAGアプリケーションの構築が容易になると説明されています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
早稲田大学、押印廃止でアドビの電子署名サービスを導入–承認プロセスの見直し図る
IT関連
2022-09-28 04:16
飛行モビリティWisk Aeroが特許侵害と企業秘密盗用の疑いでArcher Aviationを提訴
モビリティ
2021-04-08 22:50
予算達成状況をリアルタイムに把握できている企業は半数—ウイングアーク1st調査
IT関連
2022-08-23 05:00
ストライプ、不正防止ソリューションの機能を向上–クレジットカード不正使用増加に伴い
IT関連
2023-02-18 10:03
人と人をつなぐAIファーストのプラットフォームと共に歩む未来へ向けて–ZVC JAPAN・下垣社長
IT関連
2025-01-10 22:20
Natureが赤外線飛距離1.5倍の新型スマートリモコン「Nature Remo mini 2 Premium」を7月7日より発売
IoT
2021-06-25 15:03
「Windows 11」の大型アップデート「22H2」がリリースプレビューに
IT関連
2022-06-10 02:46
競争力を高めるにはDevOpsが必要、導入のリスクを下げるには
IT関連
2022-09-08 17:24
SAPジャパンが2023年方針を表明–ERPの標準使用とSaaSを訴求
IT関連
2023-02-16 07:50
「Ponta経済圏」でかなえる、オンラインとリアルを横断した広告効果測定
IT関連
2023-05-24 06:32
BPFを利用し、Linuxカーネルのパラメータを継続的に自動チューニングする「bpftune」。オラクルがオープンソースで公開
eBPF
2023-07-03 11:42
ワークデイの次期単独CEO、日本市場への思いを明かす
IT関連
2023-10-19 15:20
MS、「Windows 11」の起動エラーを自動修復するツールをリリース
IT関連
2025-04-03 09:05
コロナ禍でパパ活蔓延 SNSで飛び交う隠語……企業公式アカウントで“誤爆”も
IT関連
2021-04-03 07:14