VLLM编译环境的搭建

写在前面: 梯子的应用在文章最后 安装conda wget https://repo.anaconda.com/archive/Anaconda3-2022.05-Linux-x86_64.sh chmod +x Anaconda3-2022.05-Linux-x86_64.sh ./Anaco

崔少飞 崔少飞 发布于 2026-03-10

RagFlow智能体

什么是智能体 可以在一种流程中,最大限度的保持用户自由度的情况下,帮助用户完成某些任务. 区别于传统的"自助业务机",它最大的优势是通过用户的自然语言,自动获取相关信息并完成任务处理. 官网对智能体的定义 智能体和RAG是互补的技术,彼此增强对方在业务中的能力.在ragflow中是从0.8.0引入的

崔少飞 崔少飞 发布于 2026-01-12

rag和deepseek可能需要做的事

ragFlow 参数设置 :温度、处罚、token数、权重等。 系统提示词:(输入防护) 智能体:流程使用,操控输入输出(用于敏感词过滤,输出内容审核、后置过滤、判断违规内容) 分类词库设计:标签、元数据使用 知识库标签使用:给知识库索引打标签 VLM模型、ASR模型、Rerank模型、TTS模型选

杨立超 杨立超 发布于 2026-01-08

rag分块

分块方式 one 一个文件只生成一个 chunk,适合短文档、合同 book 针对长篇书籍(尤其是 PDF 格式),通过文本特征检测分割点,chunk

杨立超 杨立超 发布于 2026-01-08

RAG相关

基本概念与名词:http://www.uml.org.cn/ai/2025032044.asp?artid=26752 RAG(检索、增强、生成) 通过从外部知识库中检索相关信息,并将其作为提示(Prompt)输入给大型语言模型(LLMs),以增强模型处理知识密集型任务的能力,如问答、文本摘要、内容

杨立超 杨立超 发布于 2026-01-04

RAG扫盲

RAG是什么? RAG(Retrieval-Augmented Generation,检索增强生成)是一种将外部知识检索与生成式模型结合的技术,用于提升大模型回答的准确性和时效性。 RAG 的核心思想是让模型在回答问题时,先从外部知识库(如文档、数据库)中检索相关信息,再结合检索结果生成回答。其工作

崔少飞 崔少飞 发布于 2026-01-04

AI知识扫盲和环境搭建

AI的名词解释 什么是7B模型?32B模型?70B模型? B代表的是Billion(十亿),这个指的是模型的参数数量,是衡量大模型规模和能力最核心的指标之一。 什么是量化模型? 量化模型是通过降低数字精度来压缩大模型的技术,目的是让大模型能在消费级硬件(如你的CPU电脑)上运行。这是本地部署大模型

崔少飞 崔少飞 发布于 2026-01-04

20251107项目例会

双屏笔记本: 一、整体进度:延期1天 1、教师本固件移植完成,正在处理模式切换功能; 2、tablet模式/Ebook模式切换:未捕获到霍尔状态,还在和厂家联调; 3、laptop模式: (1)键盘功能,延期1天完成; (2)应用窗口切换提示:延期1天完成;教师本+显示器模式; 4、电脑助手: (1

侯文宣 侯文宣 发布于 2025-11-07

10月30日 功能演示

一、Web课件功能演示清单 1、新建之后,关闭是否给出提示;需要考虑用户怎么知道文件保存的位置,当前课件库的目录不显示了,建议显示最近; 2、最近文件:缺少本地文件的标识;引起问题:不能快速看到新建的在线文件在哪里; 3、双击本地u12,不能打开;只支持工作台打开本地; 4、关闭web课件窗口,弹出

侯文宣 侯文宣 发布于 2025-10-30

20250928演示问题

一、AI文档 1、拖动文件到顶部后,“请拖动到此处” 白条没消失; 2、反复拖动文件,进程中有多个,内存到800MB; 3、格式转换界面:长条图片底部会被按钮压住一部分; 二、电脑助手 1、webu12退出后,电脑助手没有退出; 2、在进程中杀死程序,再次打开是否需要重新登录? 3、最近文档-资料夹

董金叶 发布于 2025-09-28

文件助手通信

一、文件拖拽 1、第一步,拖动文件1s以后,draghook发出消息给文件助手,出现窄条(拖拽文件至此), { "topic":"/document/drag", "data":"{ "appName":"GCPCAssistantHook", "message":"drag-begin", "pa

侯文宣 侯文宣 发布于 2025-09-10