RAG是什么？

RAG（Retrieval-Augmented Generation，检索增强生成）是一种将外部知识检索与生成式模型结合的技术，用于提升大模型回答的准确性和时效性。

RAG 的核心思想是让模型在回答问题时，先从外部知识库（如文档、数据库）中检索相关信息，再结合检索结果生成回答。其工作流程通常分为两步：

是谁提出的？

RAG 最早由 Meta AI（Facebook）的研究团队在2020年的论文《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》中提出，将检索式模型与生成式模型（如 BART）结合，显著提升了知识密集型任务的表现。

在部署大模型（如 GPT、LLaMA）时，RAG 解决了以下关键问题：

是的，RAG的核心价值就是“扩展模型的知识面并让其与时俱进”，但它并不能完全替代训练，而是在推理/应用阶段的一种高效增强策略。

使用原来的 “思考能力” + “与时俱进的知识” = 用户想要的答案

在RAG中，编码模型特指一个将文本（无论是用户问题还是知识库文档）转换为数值向量（Embedding）的神经网络模型。

它的核心作用就一句话：把文本映射到一个数学空间中的“点”，让语义相近的文本在空间中的位置也相近。

意思就是说，就是将“回答的范围做了框选”，让大模型在“用户的询问和相应的资料范围中做回答”

训练Embeding

https://sbert.hugging-face.cn/