Home / 用語 / ベクトルデータベース

ベクトルデータベース

※本ページにはプロモーション(広告)が含まれています

一般IT用語

読みベクトルデータベース
英語Vector Database

💡 ひとことで言うと

エンベディングベクトルを保存・検索するための専用DB。意味の近いデータを高速に取り出せ、RAGの基盤となる。

詳しい解説

ベクトルデータベースは、AIで生成したエンベディングベクトル(通常は数百〜数千次元の数値配列)を効率的に保存し、近似最近傍検索(ANN検索)で高速に類似ベクトルを取り出すことに特化したデータベースです。RAG、セマンティック検索、レコメンドエンジン、画像検索といった現代AIアプリの土台で、2022年以降に急成長した技術分野です。

代表的な製品・サービスとして、①Pinecone(フルマネージド・業界代表)、②Weaviate(オープンソース・多機能)、③Qdrant(Rust製・高速)、④Milvus(大規模向けOSS)、⑤Chroma(開発者フレンドリー・ローカル向き)、⑥pgvector(PostgreSQL拡張・既存DBと統合可能)、⑦Elasticsearch(ベクトル検索も対応)、⑧Supabase Vector(pgvectorマネージド)などがあります。2026年時点では、既存RDBに機能を追加するpgvector派と、専用DBを立てる専業派の二極化が続いています。

検索アルゴリズムは、総当たり計算ではなくHNSW(Hierarchical Navigable Small World)・IVF(Inverted File Index)・PQ(Product Quantization)などの近似最近傍検索手法を使い、数億件のベクトルから数十ミリ秒で上位10件を返せます。精度とスピードのトレードオフを調整できるのが特徴で、多くの実用アプリは99%程度の精度で充分です。

使い方の流れは、①文書をチャンク分割、②エンベディングモデルでベクトル化、③メタデータ(元ID・タイムスタンプ・アクセス権など)とともにDBに格納、④クエリ時に質問もベクトル化して類似検索、⑤返ってきたメタデータで元文書を取得、⑥LLMに渡して回答生成、というRAGパイプラインが定番です。

選定の観点としては、①データ量(1万件ならpgvector、1億件超は専用DB)、②既存スタックとの統合(PostgreSQLユーザーはpgvector一択)、③マネージド vs セルフホスト、④ハイブリッド検索(キーワード+ベクトル)対応、⑤マルチテナント対応、などを総合判断する必要があります。2026年現在、小〜中規模はpgvector/Supabase、大規模はPinecone/Qdrantという棲み分けが定着しつつあります。

📘 具体的な場面

社内マニュアル3万ページのRAGチャットボットを構築する場面を想像してください。全ページをチャンク分割すると100万ベクトル規模になりますが、Pineconeに格納すれば、社員が質問を入力してから関連マニュアル5件を取得するまで50ミリ秒、LLMが回答を生成するまで合計2秒以内で完結します。従来の全文検索では単語一致でしか探せなかった『意味検索』が可能になり、『育休って何日取れる?』という曖昧な質問にも的確な章を返せるようになります。

別の呼び方

Vector DB
ベクトルデータベース
ベクトル検索DB
類似度検索DB

関連する用語

この用語に関する関連記事

Check Also

Klipsch Reference Premiereのポートプラグ対処法

【2026年最新版】Klipsch Reference Premiereのポートプラグ対処法【完全ガイド】

Klipsch Referen …