検索拡張生成(RAG)は、生成モデルと情報検索システムを組み合わせた技術です。RAGは、出力を外部ソースに基づかせることで、事実の正確性を向上させます。
目的
目的は、検索された文書を用いて応答を拡張することで、生成AIにおける幻覚を軽減することです。これは、質問応答や知識集約型タスクにおいて特に有用です。
重要性
- LLM 出力の事実上の正確性が向上します。
- ドメイン固有の知識の統合を可能にします。
- 信頼できる検索システムが必要です。
- ハイブリッド検索とオープンドメイン QA に関連します。
仕組み
- ユーザーがクエリまたはプロンプトを提供します。
- 検索システムは関連する文書を取得します。
- ドキュメントは生成モデルに渡されます。
- モデルは、取得されたコンテンツに基づいて応答を生成します。
- フィードバック ループにより将来のパフォーマンスが向上します。
例(実世界)
- 閲覧または取得プラグインを備えた OpenAI ChatGPT。
- メタ RAG モデル: 検索に基づく LLM の研究。
- Perplexity AI: 検索強化型会話型検索。
参考文献 / さらに読む
- Lewisら「知識集約型NLPのための検索拡張生成」NeurIPS 2020。
- ハギングフェイスRAG実装。
- スタンフォード HAI 検索方法に関する研究。
- RAFTとは?RAG + 微調整