PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化

今回は「PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化」についてご紹介します。

関連ワード (採用、文章、高性能等) についても参考にしながら、ぜひ本記事について議論していってくださいね。

本記事は、Publickey様で掲載されている内容を参考にしておりますので、より詳しく内容を知りたい方は、ページ下の元記事リンクより参照ください。


PostgreSQLのマネージドサービスなどを提供しているTimescaleは、PostgreSQLで高速なベクトルデータベース機能を実現する拡張機能「Pgvectorcale」をオープンソースとして公開したことを発表しました。

Pgvectorcaleをオープンソースで公開

大規模言語モデルを用いた生成AIの注目度が高まる中で、文章や画像、音声といったデータの特徴を数値で表現するベクトル化(もしくはエンベディング)により、大規模言語モデルで扱えるようにすることへの注目も高まってきています。

ベクトルデータベースは、このベクトル化された膨大なデータの保存や類似度の検索などが可能です。

例えば、RAG(Retrieval Augmented Generation)と呼ばれる手法により大規模言語モデルの回答に外部のデータベースから取得したデータを組み込むことができます。こうした場面でベクトルデータベースが活用されます。

高速ベクトルデータベース化する「Pgvectorscale」

PostgreSQLには、すでにベクトル化さあれたデータを扱うための拡張機能として「Pgvector」があります。

今回オープンソースとして公開されたPgvectorscaleは、このPgvectorを補完し、さらに高性能にするために、下記の2つの改善が行われていると説明されています。

(1)マイクロソフトの研究にヒントを得て開発された、Pgvectorデータ用の高性能でコスト効率の高いベクトル検索インデックス「StreamingDiskANN」を採用。

(2)標準的な2値量子化(Binary Quantization)を基にTimescale社の研究者が改良した統計的2値量子化(SBQ:Statistical Binary Quantization)を採用。

Timescaleによると、代表的なベクトルデータベースであるPinconeと比較して、PostgreSQLにPgvectorとPgvectorscaleでは最大で28倍高速だとしています。

fig

PostgreSQLでRAGアプリを簡単に作れる「Pgai」

また同社は、PostgreSQLにエンベディングやモデル補完などのAI関連の機能をさらに組み込む拡張機能「Pgai」も合わせてオープンソースとして公開しました。

Pgaiを用いることで、PostgreSQLを使った検索とRAGアプリケーションの構築が容易になると説明されています。

COMMENTS


Recommended

TITLE
CATEGORY
DATE
暗号資産取引所Coinbaseが直接上場
ブロックチェーン
2021-01-30 12:04
クラウド人材の育成支援が最優先事項–AWS、パートナー戦略を発表
IT関連
2023-03-19 15:10
サステナビリティーの推進に「3D」と「体験」を活用–ダッソー・システムズ
IT関連
2022-09-02 21:55
「Apple Vision Pro」向けの新OS「visionOS」–開発者が押さえておくべき17のポイント
IT関連
2023-06-22 12:35
「xOps」のコンセプト、その本質と課題とは?
IT関連
2022-04-28 23:51
Docker創始者らが開発、ビルド/テスト/デプロイの自動化をポータブルにするツール「Dagger」登場。そのままローカルでもGitHubでもCircleCIでも実行可能に
CI/CD
2022-04-19 11:18
ラクス、「楽楽明細」に「入金管理オプション」追加–ミスを防止し業務効率化
IT関連
2023-07-25 14:17
エア・ウォーター・デジタル、基幹システムのサービス品質向上でオブザーバビリティ基盤を導入
IT関連
2024-03-23 19:31
「100ワニ映画」の荒らし行為、「新宿バルト9」が現場になった理由
くらテク
2021-07-10 04:09
熱帯地域のデータセンター、高度な冷却技術が課題–シンガポールで進む取り組み
IT関連
2023-12-13 22:53
ヌーラボ、見込み客の商談化を支援する「immedio」を導入
IT関連
2024-01-17 22:49
日本ITインフラの課題解決に3つの重点事項–キンドリルジャパン、2025年度事業戦略
IT関連
2024-06-14 14:11
生徒が泳ぐ姿を4K撮影、水泳上達につなげるスイミングスクール向けスマートレッスンシステム
EdTech
2021-02-10 08:20
今あらためて見直したいサイバーセキュリティ向上策–防御力を高める10の施策
IT関連
2022-03-02 07:15