PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化

今回は「PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化」についてご紹介します。

関連ワード (採用、文章、高性能等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


PostgreSQLのマネージドサービスなどを提供しているTimescaleは、PostgreSQLで高速なベクトルデータベース機能を実現する拡張機能「Pgvectorcale」をオープンソースとして公開したことを発表しました。

Pgvectorcaleをオープンソースで公開

大規模言語モデルを用いた生成AIの注目度が高まる中で、文章や画像、音声といったデータの特徴を数値で表現するベクトル化(もしくはエンベディング)により、大規模言語モデルで扱えるようにすることへの注目も高まってきています。

ベクトルデータベースは、このベクトル化された膨大なデータの保存や類似度の検索などが可能です。

例えば、RAG(Retrieval Augmented Generation)と呼ばれる手法により大規模言語モデルの回答に外部のデータベースから取得したデータを組み込むことができます。こうした場面でベクトルデータベースが活用されます。

高速ベクトルデータベース化する「Pgvectorscale」

PostgreSQLには、すでにベクトル化さあれたデータを扱うための拡張機能として「Pgvector」があります。

今回オープンソースとして公開されたPgvectorscaleは、このPgvectorを補完し、さらに高性能にするために、下記の2つの改善が行われていると説明されています。

(1)マイクロソフトの研究にヒントを得て開発された、Pgvectorデータ用の高性能でコスト効率の高いベクトル検索インデックス「StreamingDiskANN」を採用。

(2)標準的な2値量子化(Binary Quantization)を基にTimescale社の研究者が改良した統計的2値量子化(SBQ:Statistical Binary Quantization)を採用。

Timescaleによると、代表的なベクトルデータベースであるPinconeと比較して、PostgreSQLにPgvectorとPgvectorscaleでは最大で28倍高速だとしています。

fig

PostgreSQLでRAGアプリを簡単に作れる「Pgai」

また同社は、PostgreSQLにエンベディングやモデル補完などのAI関連の機能をさらに組み込む拡張機能「Pgai」も合わせてオープンソースとして公開しました。

Pgaiを用いることで、PostgreSQLを使った検索とRAGアプリケーションの構築が容易になると説明されています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
リンガーハット、AI活用した需要予測システムを開発–AIアプリを直営店に展開
IT関連
2024-03-15 18:27
マネーフォワード、インボイス制度対応の新機能と開発ロードマップを明らかに
IT関連
2022-11-06 11:41
2日間で1億円──投げ銭“スパチャ”の流行は日本特有? YouTube幹部に直撃インタビュー
イラスト・デザイン
2021-03-19 16:06
GPT-4が検出する新たな脆弱性–サイバー攻撃への悪用を懸念する研究
IT関連
2024-06-18 04:14
創造的な挑戦を促進する組織カルチャー–DXが定着した企業の要件(その4)
IT関連
2023-06-15 15:04
GitHub社内におけるエンジニアリングガバナンスはどのように行われているのか
DevOps
2024-02-21 22:45
急成長するウガンダのスタートアップたち、Y CombinatorとGoogleも魅了
IT関連
2022-03-08 14:23
重要なのは顧客が求める成果–BlackLine CROと日本法人トップが語る戦略
IT関連
2023-07-11 00:10
ヤマトの高齢者見守りサービス、全国展開へ IoT電球の利用状況で安否確認、月額980円から
企業・業界動向
2021-02-07 05:42
センサーや電源などのユニットを組み合わせてIoTデバイスを開発できるハードウェア「PILEz」登場
企業・業界動向
2021-05-29 05:19
AIによるLinuxカーネルのチューニング–バイトダンスの新たな試み
IT関連
2023-12-05 04:22
AVEVA と日本IBM、低炭素実現に向け戦略的提携を実施–製造業のエネルギー転換を支援
IT関連
2023-11-18 08:40
歩いて日本地図の完成目指す歩数計「令和の伊能忠敬」発売 実距離なら約1万9000km
くらテク
2021-07-07 01:57
マイクロソフト、「従業員エクスペリエンス」向上にフォーカスしたイベントを米国時間2月4日に
IT関連
2021-02-01 22:34