※本ページにはプロモーション(広告)が含まれています
エンベディングベクトルを保存・検索するための専用DB。意味の近いデータを高速に取り出せ、RAGの基盤となる。
詳しい解説
ベクトルデータベースは、AIで生成したエンベディングベクトル(通常は数百〜数千次元の数値配列)を効率的に保存し、近似最近傍検索(ANN検索)で高速に類似ベクトルを取り出すことに特化したデータベースです。RAG、セマンティック検索、レコメンドエンジン、画像検索といった現代AIアプリの土台で、2022年以降に急成長した技術分野です。
代表的な製品・サービスとして、①Pinecone(フルマネージド・業界代表)、②Weaviate(オープンソース・多機能)、③Qdrant(Rust製・高速)、④Milvus(大規模向けOSS)、⑤Chroma(開発者フレンドリー・ローカル向き)、⑥pgvector(PostgreSQL拡張・既存DBと統合可能)、⑦Elasticsearch(ベクトル検索も対応)、⑧Supabase Vector(pgvectorマネージド)などがあります。2026年時点では、既存RDBに機能を追加するpgvector派と、専用DBを立てる専業派の二極化が続いています。
検索アルゴリズムは、総当たり計算ではなくHNSW(Hierarchical Navigable Small World)・IVF(Inverted File Index)・PQ(Product Quantization)などの近似最近傍検索手法を使い、数億件のベクトルから数十ミリ秒で上位10件を返せます。精度とスピードのトレードオフを調整できるのが特徴で、多くの実用アプリは99%程度の精度で充分です。
使い方の流れは、①文書をチャンク分割、②エンベディングモデルでベクトル化、③メタデータ(元ID・タイムスタンプ・アクセス権など)とともにDBに格納、④クエリ時に質問もベクトル化して類似検索、⑤返ってきたメタデータで元文書を取得、⑥LLMに渡して回答生成、というRAGパイプラインが定番です。
選定の観点としては、①データ量(1万件ならpgvector、1億件超は専用DB)、②既存スタックとの統合(PostgreSQLユーザーはpgvector一択)、③マネージド vs セルフホスト、④ハイブリッド検索(キーワード+ベクトル)対応、⑤マルチテナント対応、などを総合判断する必要があります。2026年現在、小〜中規模はpgvector/Supabase、大規模はPinecone/Qdrantという棲み分けが定着しつつあります。
社内マニュアル3万ページのRAGチャットボットを構築する場面を想像してください。全ページをチャンク分割すると100万ベクトル規模になりますが、Pineconeに格納すれば、社員が質問を入力してから関連マニュアル5件を取得するまで50ミリ秒、LLMが回答を生成するまで合計2秒以内で完結します。従来の全文検索では単語一致でしか探せなかった『意味検索』が可能になり、『育休って何日取れる?』という曖昧な質問にも的確な章を返せるようになります。
別の呼び方
ベクトルデータベース
ベクトル検索DB
類似度検索DB
minto.tech スマホ(Android/iPhone)・PC(Mac/Windows)の便利情報をお届け! 月間アクセス160万PV!スマートフォン、タブレット、パソコン、地デジに関する素朴な疑問や、困ったこと、ノウハウ、コツなどが満載のお助け記事サイトはこちら!