词条解释
普通模型回答问题时主要依赖训练阶段学到的知识,而 RAG 会在生成答案之前查询指定资料源,再把相关片段交给模型组织成自然语言回答。资料源可以是企业文档、产品手册、数据库、网页或内部制度。
为什么重要
RAG 解决的是大模型落地中的一个常见问题:模型表达能力很强,但并不天然知道企业私有资料和持续变化的信息。通过增加检索环节,回答依据更容易被控制和核对,也更适合用于专业场景。
典型应用
- 知识问答:将文档、制度或产品资料整理为可检索知识来源,辅助回答具体问题。
- 文档分析:围绕合同、论文、说明书或会议资料提取信息并形成摘要。
- 客服支持:结合更新后的业务资料回答常见咨询,减少信息过期带来的误差。
常见误区
- RAG 不等于简单搜索:检索结果还会交给模型理解、归纳并生成回答。
- RAG 不能完全消除幻觉:资料质量、切分方式、召回结果和模型配置都会影响答案。
- 知识库需要持续维护:过期资料会直接降低回答的可信度。
相关词条包括向量数据库、词嵌入、大语言模型。