※本ページにはプロモーション(広告)が含まれています
生成AIに社内ドキュメント等を検索させて回答させる仕組み。学習データにない最新・独自情報でも正確に答えられる。
詳しい解説
RAGは『Retrieval-Augmented Generation(検索拡張生成)』の略で、生成AIに外部データベースや社内ドキュメントを検索させ、その検索結果を根拠にして回答を生成させる仕組みです。2020年にMetaの論文で提案され、2023年以降のエンタープライズAI活用の中核技術として広がりました。
LLMには『最新情報を知らない』『独自情報を持っていない』『ハルシネーションを起こす』という3つの弱点があります。RAGはこれらをまとめて解決する処方箋で、①ユーザー質問を受け取る、②関連ドキュメントをベクトル検索で取り出す、③取得したドキュメントをLLMに『これを根拠に答えて』と渡す、④LLMが根拠つきで回答する、という流れで動作します。
技術的には『エンベディング(文章を数値ベクトル化)』+『ベクトルデータベース(Pinecone・Weaviate・Qdrant・pgvectorなど)』+『LLM』の3点セットで構成されます。質問と意味が近いドキュメントを取得する『セマンティック検索』が核で、キーワード一致ではなく意味の近さで検索できる点が従来の全文検索と決定的に違います。
代表的な用途としては、①社内ナレッジQAボット(数千ページの社内マニュアルを即答)、②カスタマーサポート自動化、③契約書レビュー、④論文レビュー、⑤製品ドキュメントチャット、⑥法律相談補助などがあります。ChatGPTのカスタムGPT、ClaudeのProjects、Notion AI、Microsoft 365 Copilotなどはいずれも背後でRAGを動かしています。
課題も残っており、①検索精度が悪いと誤回答が増える、②取得文書が古いと古い回答になる、③機密文書のアクセス権制御が複雑、④チャンク分割(文書を何文字で切るか)で品質が変動する、などチューニングの勘所が多いのが実情です。2026年現在、ドキュメント取込から検索・生成まで一気通貫で提供するマネージドRAGサービス(Amazon Bedrock Knowledge Bases、Azure AI Searchなど)の利用が主流化しています。
社員5,000人の企業で、人事部への問い合わせ『育児休業の申請書類はどこ?』『有給の繰越ルールは?』が毎月数百件発生しているとします。就業規則・人事マニュアル・過去問答集をRAGシステムに投入すると、チャットボットが根拠文書付きで自動回答し、問い合わせ数を7割減らせた、という事例が珍しくなくなりました。LLM単体では『自社のルール』を知らないため答えられない領域を、RAGが埋めるという構図です。
別の呼び方
検索拡張生成
RAG検索
Retrieval-Augmented Generation
minto.tech スマホ(Android/iPhone)・PC(Mac/Windows)の便利情報をお届け! 月間アクセス160万PV!スマートフォン、タブレット、パソコン、地デジに関する素朴な疑問や、困ったこと、ノウハウ、コツなどが満載のお助け記事サイトはこちら!