RAG、微调、Prompt、Agent Workflow,企业什么时候该选哪个?
企业做 AI 应用时,最常见的误区是把 RAG、微调、Prompt 和 Agent Workflow 当成互相替代的银弹。更可靠的做法是先判断问题类型,再选择技术路径。
查找相关文章
输入工具名、术语或排障信息,直接找到站内相关内容。
核心结论
Prompt 解决表达问题,RAG 解决可更新知识和引用问题,微调解决稳定行为问题,Agent Workflow 解决多步骤执行和可审计协作问题。
适合谁读
适合企业 AI 产品负责人、技术负责人、知识库团队、运营团队和准备规划 AI 系统架构的团队。
关键判断
如果一开始选错路径,后面很容易出现知识不可更新、权限不可控、输出不可查、成本不可解释的问题。
下一步
先用本文的判断表给当前业务场景分类,再决定是否需要组合方案。
你将学到
- + 如何区分 Prompt、RAG、微调和 Agent Workflow 的职责
- + 不同业务问题应该优先选择哪条技术路径
- + 为什么不要把微调当成知识库压缩包
- + 企业 GEO、客服、内容生产和内部知识场景如何组合这些能力
企业做 AI 应用时,经常会在四个词之间摇摆:Prompt、RAG、微调、Agent Workflow。销售材料里它们都很强,内部讨论时也都像答案。但真正落地时,问题通常不是“哪个技术更先进”,而是“当前业务问题到底属于哪一类”。
如果一个客服机器人答错,是因为提示词写得不清楚,还是因为知识库没有更新?如果一个投研助手输出不稳定,是因为模型不懂格式,还是因为流程里缺少数据校验?如果一个品牌在 AI Search 里被错误理解,是缺少权威页面,还是需要改变内容资产结构?
选错路径会带来长期成本。把应该用 RAG 解决的问题做成微调,会让知识更新和权限撤回变困难。把需要工作流审计的任务塞进 Prompt,会让错误无处追踪。把简单提示词问题做成 Agent 系统,又会把本来轻量的需求做重。
一句话区分四种路径
| 路径 | 主要解决什么 | 不适合解决什么 |
|---|---|---|
| Prompt | 表达、约束、格式、少量示例 | 大规模知识更新、复杂权限、长期审计 |
| RAG | 可更新知识、来源引用、权限隔离 | 稳定行为习惯、复杂执行流程 |
| 微调 | 固定任务习惯、分类口径、风格和结构稳定性 | 频繁变化的知识、未授权内容、可撤回信息 |
| Agent Workflow | 多步骤执行、工具调用、状态记录、审批和复核 | 单轮问答、低风险轻量改写 |
这四种能力不是互斥关系。成熟系统往往会组合使用:Prompt 控制表达,RAG 提供证据,微调稳定行为,Agent Workflow 负责执行和审计。
Prompt:先从最小可行约束开始
Prompt 适合低风险、低成本、快速验证的场景。例如:把会议纪要整理成固定结构、把客服回复改成更礼貌的语气、把输入材料归纳成三段摘要、把内部文案统一成某种格式。
Prompt 的优势是快、便宜、可改。业务同事看得懂,也能在几轮迭代里发现问题。但 Prompt 的边界也很明显:它不擅长承载大规模知识,不擅长处理用户权限,也不擅长保证复杂流程每一步都可追踪。
如果问题可以通过更清晰的输入、更稳定的模板、更好的示例解决,就不要急着上微调或 Agent。
RAG:知识会变、来源要查,就优先考虑它
RAG 的核心不是“让模型背下更多知识”,而是把模型连接到可检索、可更新、可撤回的知识系统。对企业来说,这一点非常关键。
适合 RAG 的典型问题包括:
- 产品政策、价格、版本说明经常变化;
- 答案必须引用来源页面或内部文档;
- 不同员工、客户、部门有不同访问权限;
- 发现错误后需要快速修正文档,而不是重新训练模型;
- 希望保留“模型根据哪些资料回答”的证据。
RAG 也不是万能的。如果知识库质量差、切片混乱、元数据缺失、权限设计不清,RAG 只会把混乱放大。很多企业 RAG 项目失败,不是模型不行,而是文档治理、检索召回和来源排序没有做好。
微调:适合稳定行为,不适合塞知识
微调最适合解决“模型怎么做事”的问题,而不是“模型知道什么”的问题。
例如,企业希望模型稳定按照某个行业分类体系打标签,稳定输出结构化 JSON,稳定识别工单优先级,稳定遵守某种术语风格,稳定把复杂输入转成内部系统字段。这些都可能适合微调。
但如果企业只是想让模型知道最新产品手册、最新价格、最新政策,微调通常不是优先方案。知识一旦写进权重,更新、撤回、授权追踪都会变难。
微调还有一个经常被低估的问题:它会改变模型行为边界。Kunpeng AI 此前解读过一篇关于微调与逐字记忆复现的研究,研究者声称某些模型在微调后可能重新激活预训练阶段记住的内容。这个发现不意味着企业不能微调,但意味着微调前后都要做数据来源审计和输出复现测试。
Agent Workflow:当任务不是回答,而是执行
很多企业需求表面上是“问 AI”,本质上是“让 AI 完成一串工作”。例如:
- 读取客户工单,判断类型,查知识库,生成回复,提交给人工审核;
- 抓取站点数据,检查 SEO 问题,生成巡检简报,发送通知;
- 根据品牌定位生成 GEO 问题集,跨平台测试 AI 回答,记录证据;
- 读取报表,发现异常,创建任务,等待负责人确认。
这些场景需要的不只是模型回答,而是工具调用、状态管理、重试、日志、人工确认和结果审计。这就是 Agent Workflow 的位置。
Agent Workflow 的风险在于复杂度。流程越长,越需要边界:哪些步骤能自动做,哪些步骤必须等人确认,失败后如何重试,输出如何留痕,权限如何限制。
一个实用判断表
| 你遇到的问题 | 优先路径 |
|---|---|
| 输出格式不稳定,但输入材料都在上下文里 | Prompt |
| 答案需要引用公司文档、政策、案例或网页 | RAG |
| 知识频繁变化,需要快速修正 | RAG |
| 模型总是不按内部分类标准判断 | 微调 |
| 模型需要稳定输出某种结构或风格 | Prompt 或微调 |
| 任务需要调用工具、提交表单、写日志、等待审批 | Agent Workflow |
| 不同用户能看到的资料不同 | RAG 加权限系统 |
| 上线后必须可追溯每一步 | Agent Workflow 加审计日志 |
| 内容存在版权、隐私、商业秘密风险 | 先做数据审计,再决定路径 |
企业 GEO 场景怎么组合
以 AI Search / GEO 品牌诊断为例,四种路径可以各司其职。
Prompt 可以定义诊断问题和输出格式,例如“按品牌识别、推荐理由、引用来源、风险点四栏输出”。RAG 可以整理官网、案例页、服务页、新闻稿和第三方报道,让分析有证据来源。Agent Workflow 可以定时执行跨平台巡检、截图、记录 URL、生成简报。微调则不一定是第一选择,除非企业要长期稳定地分类大量品牌回答、行业标签和问题类型。
这也是为什么 GEO 不是“多发几篇文章等 AI 收录”。更可靠的方式是先定义希望 AI 理解你的什么定位,再设计验证问题,最后修正 AI 旧认知和弱证据来源。
常见误区
第一,把 RAG 当成数据库魔法。RAG 依赖文档质量、切片策略、元数据、召回排序和权限设计。知识库本身乱,答案也会乱。
第二,把微调当成知识库压缩包。微调后的知识不容易撤回,也不容易解释来源。对会变化、需授权、需引用的内容,RAG 通常更稳。
第三,把 Prompt 当成流程系统。Prompt 可以约束表达,但不能替代日志、权限、审批、重试和回滚。
第四,把 Agent Workflow 当成“越复杂越好”。Agent 系统应该围绕真实业务动作设计,不应该为了显得智能而增加步骤。
Kunpeng AI 观察
企业 AI 落地最重要的能力之一,是把“模型能力”拆成“业务问题”。你不是在选择一个流行词,而是在选择知识如何更新、权限如何控制、输出如何复核、错误如何追踪。
在 GEO 和 AI Search 场景里,这种拆分尤其重要。品牌不是靠一次提示词就被 AI 正确认知,也不是靠一次微调就解决所有搜索问题。企业需要可验证的问题集、可引用的内容资产、可重复的巡检流程,以及对模型行为边界的持续评估。
相关阅读:
继续阅读
要点总结
- - Prompt 是最低成本入口,但不适合承载复杂权限和持续更新知识。
- - RAG 的核心价值不是让模型更聪明,而是让答案可更新、可引用、可撤回。
- - 微调更适合稳定行为模式,不适合塞入大批会变化的业务知识。
- - Agent Workflow 适合需要工具调用、状态记录、审批、重试和审计的工作。
常见问题
企业 AI 应用是不是都应该先做 RAG?
不一定。如果任务只是固定格式改写或轻量分类,Prompt 可能足够。如果任务需要调用工具、提交系统、等待审批,单独 RAG 也不够。
微调能不能替代知识库?
通常不建议。会变化、需要权限控制、需要引用来源的知识,更适合放在检索系统里,而不是写进模型权重。
Agent Workflow 是不是比 RAG 更高级?
不是层级关系。Agent Workflow 关注任务执行过程,RAG 关注知识检索和引用。很多企业系统会把二者组合使用。