崔少飞
发布于 2026-01-04 / 1 阅读
0
0

RAG扫盲

RAG是什么?

RAG(Retrieval-Augmented Generation,检索增强生成)是一种将外部知识检索与生成式模型结合的技术,用于提升大模型回答的准确性和时效性。

RAG 的核心思想是让模型在回答问题时,先从外部知识库(如文档、数据库)中检索相关信息,再结合检索结果生成回答。其工作流程通常分为两步:

image-gxdf.png

是谁提出的?

RAG 最早由 Meta AI(Facebook)的研究团队在2020年的论文《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》中提出,将检索式模型与生成式模型(如 BART)结合,显著提升了知识密集型任务的表现。

与模型部署的关系

在部署大模型(如 GPT、LLaMA)时,RAG 解决了以下关键问题:

image-srmb.png

是否就是说,如果有了RAG,就相当于扩展了模型的知识面?可以让模型与时俱进的回答问题,模型甚至都不需要训练??

是的,RAG的核心价值就是“扩展模型的知识面并让其与时俱进”,但它并不能完全替代训练,而是在推理/应用阶段的一种高效增强策略。

image-rxgy.png

image-kmdj.png

使用原来的 “思考能力” + “与时俱进的知识” = 用户想要的答案

在RAG中,什么是编码模型?这个东西和基本的模型有什么关系吗?

在RAG中,编码模型特指一个将文本(无论是用户问题还是知识库文档)转换为数值向量(Embedding)的神经网络模型。

它的核心作用就一句话:把文本映射到一个数学空间中的“点”,让语义相近的文本在空间中的位置也相近。

image-ydti.png

image-fwov.png

image-eful.png

意思就是说,就是将“回答的范围做了框选”,让大模型在“用户的询问和相应的资料范围中做回答”

RAGFLow 也要训练吗?

image-vdnw.png

训练Embeding

https://github.com/FlagOpen/FlagEmbedding

https://sbert.hugging-face.cn/

RAGFlow 切片方法汇总

image-tple.png

image-jklm.png

image-bicb.png

image-qnhl.png

image-qdum.png

image-fxux.png

image-rzwn.png

image-uyrt.png

image-jlsv.png

image-xzpb.png

image-ajgu.png

image-lsiu.png


评论