幻兹百科
检索增强生成
概念
RAG
摘要
RAG(检索增强生成)是一种让大语言模型先从外部知识库检索资料,再基于检索结果生成回答的技术,用于减少幻觉、提升回答的准确性和可追溯性。

词条解释

普通模型回答问题时主要依赖训练阶段学到的知识,而 RAG 会在生成答案之前查询指定资料源,再把相关片段交给模型组织成自然语言回答。资料源可以是企业文档、产品手册、数据库、网页或内部制度。

为什么重要

RAG 解决的是大模型落地中的一个常见问题:模型表达能力很强,但并不天然知道企业私有资料和持续变化的信息。通过增加检索环节,回答依据更容易被控制和核对,也更适合用于专业场景。

典型应用

  • 知识问答:将文档、制度或产品资料整理为可检索知识来源,辅助回答具体问题。
  • 文档分析:围绕合同、论文、说明书或会议资料提取信息并形成摘要。
  • 客服支持:结合更新后的业务资料回答常见咨询,减少信息过期带来的误差。

常见误区

  • RAG 不等于简单搜索:检索结果还会交给模型理解、归纳并生成回答。
  • RAG 不能完全消除幻觉:资料质量、切分方式、召回结果和模型配置都会影响答案。
  • 知识库需要持续维护:过期资料会直接降低回答的可信度。

相关词条包括向量数据库词嵌入大语言模型

基础信息
中文名
检索增强生成
英文名
RAG
类别
概念
相关工具
相关工具数据待接入
Copyright © 幻兹网 All Rights Reserved粤ICP备2026034579号粤公网安备44030002012995号