登录
首页 >  科技周边 >  人工智能

WorkBuddy支持切换RAG模型吗?

时间:2026-04-30 09:22:10 243浏览 收藏

WorkBuddy虽不提供“一键切换RAG模型”的直观开关,但其深度集成的RAG能力远超表面认知——通过启用预置RAG Skill绑定Qwen3-4B或GLM-4、直连本地LlamaIndex+Chroma服务、设置语义关键词自动触发专用推理流,或用CLI命令行精准控制检索上下文,用户可灵活适配从轻量文档问答到企业级私有知识库搜索的全场景需求;无论你是想秒查D盘合同里的“违约责任”,还是调用本地知识库精准定位《员工手册》第3.2条,WorkBuddy都已在底层为你铺好高精度、低延迟、强隐私的RAG落地路径。

WorkBuddy 支持一键切换到搜索增强(RAG)模型吗?

如果您在使用WorkBuddy时希望提升对本地文档、知识库或私有资料的检索精度与上下文相关性,则可能需要启用具备搜索增强能力的RAG模型。WorkBuddy本身不直接提供名为“搜索增强(RAG)模型”的独立切换选项,但其底层架构支持通过特定Skill与模型协同实现RAG效果。以下是实现该能力的多种可行路径:

一、启用内置RAG Skill并绑定兼容模型

WorkBuddy的12个RAG应用Skill已预置在openclaw与WorkBuddy生态中,这些Skill依赖vLLM部署的Qwen3-4B-Instruct-2507等模型完成向量检索与重排序。启用前需确保所选模型具备文本嵌入与语义匹配能力。

1、启动WorkBuddy后,点击右上角个人头像,进入「设置」菜单。

2、在左侧导航栏中选择「AI模型管理」,确认「启用多模型热切换」已开启。

3、返回主界面,在对话框中输入指令:“安装RAG搜索套件”或“启用文档问答Skill”。

4、系统将自动加载openclaw中已签名审核的RAG Skill,并提示绑定模型;此时请选择已验证通过的Qwen3-4B-Instruct-2507或GLM-4-Flash。

5、绑定完成后,输入“搜索我D盘中的合同文件关键词‘违约责任’”,WorkBuddy将调用RAG Skill执行本地文件扫描与语义匹配。

二、手动配置Claw端RAG服务代理

该方式绕过默认Skill调度链路,直接将用户查询转发至本地运行的RAG服务(如LlamaIndex+Chroma),适用于已有私有知识库部署场景。WorkBuddy通过Claw协议接管HTTP请求并注入认证头,确保权限隔离。

1、在本地启动RAG服务,监听端口为http://127.0.0.1:8000/rag/query。

2、进入「Claw设置」→「自定义API网关」,点击「新增代理规则」。

3、填写目标URL为http://127.0.0.1:8000/rag/query,方法选择POST,勾选「启用请求体透传」。

4、在「请求头映射」中添加键值对:X-WorkBuddy-Session-ID → {session_id},用于会话级上下文绑定。

5、保存后,在任意对话中输入“RAG模式:查找《员工手册》第3.2条内容”,WorkBuddy将把该请求完整转发至本地服务并返回结构化结果。

三、通过模型偏好设置触发RAG专用推理流

新版WorkBuddy支持基于任务语义自动路由至不同推理路径。当检测到用户指令含“搜索”“查文档”“找原文”等关键词时,系统可强制跳转至预设的RAG模型通道,该通道默认挂载Qwen3-4B-Instruct-2507及配套向量数据库索引器。

1、进入「AI模型管理」→「模型偏好设置」,点击「新增语义规则」。

2、在「触发关键词」字段中输入:搜索、查文档、定位原文、检索条款、翻阅记录。

3、在「目标模型」下拉菜单中选择Qwen3-4B-Instruct-2507,并勾选「启用RAG增强上下文注入」。

4、点击「保存规则」,系统立即编译新路由策略。

5、随后发送消息“搜索我上周发给张经理的PDF里关于付款周期的描述”,WorkBuddy将自动激活RAG流程,包括文件解析、块切分、向量化匹配与答案生成。

四、使用CLI命令行强制注入RAG执行上下文

对于高级用户,可通过WorkBuddy内置CLI接口绕过UI限制,直接指定RAG模型与检索参数。该方式适用于批处理、脚本集成或调试场景,所有操作均在本地沙箱内完成,不上传原始数据。

1、打开终端,执行workbuddy --list-skills,确认rag-search-v2已显示为enabled状态。

2、运行命令:workbuddy --model Qwen3-4B-Instruct-2507 --skill rag-search-v2 --param index_path="/Users/me/kb/contracts" --query "不可抗力条款适用范围"。

3、系统将跳过常规对话流,直连本地向量索引目录,执行精确语义检索。

4、响应结果以JSON格式返回匹配段落、置信度分数及原始文件路径,例如:{"match":"第十二条第二款","score":0.92,"file":"/kb/contracts/2025_supply_agreement.pdf"}

终于介绍完啦!小伙伴们,这篇关于《WorkBuddy支持切换RAG模型吗?》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布科技周边相关知识,快来关注吧!

资料下载
相关阅读
更多>
最新阅读
更多>
课程推荐
更多>