PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化

今回は「PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化」についてご紹介します。

関連ワード (採用、文章、高性能等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


PostgreSQLのマネージドサービスなどを提供しているTimescaleは、PostgreSQLで高速なベクトルデータベース機能を実現する拡張機能「Pgvectorcale」をオープンソースとして公開したことを発表しました。

Pgvectorcaleをオープンソースで公開

大規模言語モデルを用いた生成AIの注目度が高まる中で、文章や画像、音声といったデータの特徴を数値で表現するベクトル化(もしくはエンベディング)により、大規模言語モデルで扱えるようにすることへの注目も高まってきています。

ベクトルデータベースは、このベクトル化された膨大なデータの保存や類似度の検索などが可能です。

例えば、RAG(Retrieval Augmented Generation)と呼ばれる手法により大規模言語モデルの回答に外部のデータベースから取得したデータを組み込むことができます。こうした場面でベクトルデータベースが活用されます。

高速ベクトルデータベース化する「Pgvectorscale」

PostgreSQLには、すでにベクトル化さあれたデータを扱うための拡張機能として「Pgvector」があります。

今回オープンソースとして公開されたPgvectorscaleは、このPgvectorを補完し、さらに高性能にするために、下記の2つの改善が行われていると説明されています。

(1)マイクロソフトの研究にヒントを得て開発された、Pgvectorデータ用の高性能でコスト効率の高いベクトル検索インデックス「StreamingDiskANN」を採用。

(2)標準的な2値量子化(Binary Quantization)を基にTimescale社の研究者が改良した統計的2値量子化(SBQ:Statistical Binary Quantization)を採用。

Timescaleによると、代表的なベクトルデータベースであるPinconeと比較して、PostgreSQLにPgvectorとPgvectorscaleでは最大で28倍高速だとしています。

fig

PostgreSQLでRAGアプリを簡単に作れる「Pgai」

また同社は、PostgreSQLにエンベディングやモデル補完などのAI関連の機能をさらに組み込む拡張機能「Pgai」も合わせてオープンソースとして公開しました。

Pgaiを用いることで、PostgreSQLを使った検索とRAGアプリケーションの構築が容易になると説明されています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
「Ubuntu Desktop 20.04」が快適に実行–「Odyssey」を見る
IT関連
2021-03-07 17:53
やった!ついにSnapが黒字に
IT関連
2022-02-05 14:26
ウェブ開発者なら学んでおいた方がいいプログラミング言語はどれか?
IT関連
2021-03-13 15:00
Anaplan Japan、不確実性が増すビジネス環境下の計画業務を支援
IT関連
2023-12-17 11:31
競合は米国企業–富士通が研究開発リソースを投じる、5つの技術領域
IT関連
2023-10-21 03:30
GitHub、Issueに親子関係を設定できる「Sub-Issues」機能をパブリックプレビューとして公開、誰でも利用可能に
GitHub
2025-01-22 22:52
アップルとグーグルがアプリストアの競争に関する米上院公聴会に出席
その他
2021-04-14 22:20
ライフがネットスーパーの新会社 配送網の整備や専用アプリの開発など
企業・業界動向
2021-04-09 16:29
ネットワンシステムズ、神奈川県内市町村のガバメントクラウド接続を容易に
IT関連
2024-06-26 21:34
Reddit、最大7億ドルの増資計画 企業価値は100億ドルに
企業・業界動向
2021-08-14 12:33
NTT東、新Wi-Fi規格「11ah」を賃貸管理に活用–遠隔からトラブル対応
IT関連
2024-11-07 03:10
老舗製薬会社の生き残り戦略はシステムの内製化 自由なデータ活用、開発の高速化を実現
PR
2021-03-09 09:45
データの外販や協業など「データ流通」が本格化–PwCが示すデータマネタイゼーションの実態と今後
IT関連
2023-03-16 00:34
金融の未来はオープンソースにあり
IT関連
2022-12-27 16:17