ベクトルデータベース

公開日：2026/04/18　更新日：2026/05/26　

※本ページにはプロモーション(広告)が含まれています

一般IT用語

読みベクトルデータベース
英語Vector Database

ひとことでいうと

エンベディングベクトルを保存・検索するための専用DB。意味の近いデータを高速に取り出せ、RAGの基盤となる。

詳しい解説

ベクトルデータベースは、AIで生成したエンベディングベクトル（通常は数百〜数千次元の数値配列）を効率的に保存し、近似最近傍検索（ANN検索）で高速に類似ベクトルを取り出すことに特化したデータベースです。RAG、セマンティック検索、レコメンドエンジン、画像検索といった現代AIアプリの土台で、2022年以降に急成長した技術分野です。

代表的な製品・サービスとして、①Pinecone（フルマネージド・業界代表）、②Weaviate（オープンソース・多機能）、③Qdrant（Rust製・高速）、④Milvus（大規模向けOSS）、⑤Chroma（開発者フレンドリー・ローカル向き）、⑥pgvector（PostgreSQL拡張・既存DBと統合可能）、⑦Elasticsearch（ベクトル検索も対応）、⑧Supabase Vector（pgvectorマネージド）などがあります。2026年時点では、既存RDBに機能を追加するpgvector派と、専用DBを立てる専業派の二極化が続いています。

検索アルゴリズムは、総当たり計算ではなくHNSW（Hierarchical Navigable Small World）・IVF（Inverted File Index）・PQ（Product Quantization）などの近似最近傍検索手法を使い、数億件のベクトルから数十ミリ秒で上位10件を返せます。精度とスピードのトレードオフを調整できるのが特徴で、多くの実用アプリは99%程度の精度で充分です。

使い方の流れは、①文書をチャンク分割、②エンベディングモデルでベクトル化、③メタデータ（元ID・タイムスタンプ・アクセス権など）とともにDBに格納、④クエリ時に質問もベクトル化して類似検索、⑤返ってきたメタデータで元文書を取得、⑥LLMに渡して回答生成、というRAGパイプラインが定番です。

選定の観点としては、①データ量（1万件ならpgvector、1億件超は専用DB）、②既存スタックとの統合（PostgreSQLユーザーはpgvector一択）、③マネージド vs セルフホスト、④ハイブリッド検索（キーワード＋ベクトル）対応、⑤マルチテナント対応、などを総合判断する必要があります。2026年現在、小〜中規模はpgvector／Supabase、大規模はPinecone／Qdrantという棲み分けが定着しつつあります。

具体的な場面

社内マニュアル3万ページのRAGチャットボットを構築する場面を想像してください。全ページをチャンク分割すると100万ベクトル規模になりますが、Pineconeに格納すれば、社員が質問を入力してから関連マニュアル5件を取得するまで50ミリ秒、LLMが回答を生成するまで合計2秒以内で完結します。従来の全文検索では単語一致でしか探せなかった『意味検索』が可能になり、『育休って何日取れる？』という曖昧な質問にも的確な章を返せるようになります。