PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化

今回は「PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化」についてご紹介します。

関連ワード (採用、文章、高性能等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


PostgreSQLのマネージドサービスなどを提供しているTimescaleは、PostgreSQLで高速なベクトルデータベース機能を実現する拡張機能「Pgvectorcale」をオープンソースとして公開したことを発表しました。

Pgvectorcaleをオープンソースで公開

大規模言語モデルを用いた生成AIの注目度が高まる中で、文章や画像、音声といったデータの特徴を数値で表現するベクトル化(もしくはエンベディング)により、大規模言語モデルで扱えるようにすることへの注目も高まってきています。

ベクトルデータベースは、このベクトル化された膨大なデータの保存や類似度の検索などが可能です。

例えば、RAG(Retrieval Augmented Generation)と呼ばれる手法により大規模言語モデルの回答に外部のデータベースから取得したデータを組み込むことができます。こうした場面でベクトルデータベースが活用されます。

高速ベクトルデータベース化する「Pgvectorscale」

PostgreSQLには、すでにベクトル化さあれたデータを扱うための拡張機能として「Pgvector」があります。

今回オープンソースとして公開されたPgvectorscaleは、このPgvectorを補完し、さらに高性能にするために、下記の2つの改善が行われていると説明されています。

(1)マイクロソフトの研究にヒントを得て開発された、Pgvectorデータ用の高性能でコスト効率の高いベクトル検索インデックス「StreamingDiskANN」を採用。

(2)標準的な2値量子化(Binary Quantization)を基にTimescale社の研究者が改良した統計的2値量子化(SBQ:Statistical Binary Quantization)を採用。

Timescaleによると、代表的なベクトルデータベースであるPinconeと比較して、PostgreSQLにPgvectorとPgvectorscaleでは最大で28倍高速だとしています。

fig

PostgreSQLでRAGアプリを簡単に作れる「Pgai」

また同社は、PostgreSQLにエンベディングやモデル補完などのAI関連の機能をさらに組み込む拡張機能「Pgai」も合わせてオープンソースとして公開しました。

Pgaiを用いることで、PostgreSQLを使った検索とRAGアプリケーションの構築が容易になると説明されています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
ずっと無料で使えるクラウドの「Free Tier」主要サービスまとめ。2021年版
AWS
2021-06-21 20:08
「Android版Googleアプリが落ちる問題」の比較的まともな対処法【公式案内の追記あり】
くわしく
2021-06-23 12:38
キーワードから小説や画像を自動生成 自然言語処理の革命児「GPT-3」の衝撃 (1/2)
くわしく
2021-01-17 17:16
AI開発×スパコンのSIer、HPCシステムズがAIシステム導入で産官学から支持されるワケ
PR
2021-01-27 06:19
マイクロソフトが目指す「インダストリアルメタバース」とその布石
IT関連
2022-05-17 17:13
センサー内蔵の野球ボール活用で選手データを分析・管理 KDDIなど
企業・業界動向
2021-03-02 11:45
SaaSへのAI組み込みの速さを強調する日本オラクル社長の思いとは
IT関連
2025-02-22 02:19
富士ソフト、蔦屋書店のシステムをAWS上でリアーキテクト
IT関連
2021-01-15 03:49
セガ、Qlikのデータ分析製品群を導入–約450のレポートを自動生成
IT関連
2022-06-08 06:54
オリックス・ビジネスセンター沖縄、業務デジタル化基盤を刷新–現場主体で業務アプリを開発
IT関連
2022-10-09 08:24
「AlphaZero」の先へ–強化学習によるロボット訓練、研究者が示した複雑さと期待
IT関連
2021-03-29 04:46
イオン、パナソニックのAI業務アプリでバックオフィスを改革
IT関連
2022-03-01 10:54
グーグル、「Chrome」の新たなゼロデイ脆弱性の修正を公開
IT関連
2022-09-07 20:42
React for Web/Reat Native両対応のUIフレームワーク「Tamagui 1.0」正式リリース。最適化コンパイラで高速なレンダリングなど実現
HTML/CSS
2023-01-05 00:32