很多企业的AI系统开局都差不多:一个智能体,一大段提示词,一堆工具,满怀期待。初期看着挺美——能回答问题、调用几个系统、甚至跑完一个完整流程。但等场景稍微复杂点,裂缝就出现了。

这个智能体要懂的东西太多,要接的系统太多,要做的决策类型也太多。一旦出问题,你根本搞不清楚毛病出在哪。这时候问题就不再是"提示词写得好不好",而是"系统设计行不行"。

打开网易新闻 查看精彩图片

有个模式我觉得特别实用:智能体之间的分工协作。不是因为它听起来高级,而是这往往是企业AI更务实的构建方式。

打开网易新闻 查看精彩图片

单一大型智能体的真实困境

"让一个智能体全包了"这种说法有种诱人的简洁感。但企业工作流很少这么干净。拿表面上挺简单的"客户投诉升级"来说,要处理好,系统可能得:拉取工单历史、理解产品背景、核对支持政策、查看账户状态、推荐后续动作、触发内部流程、起草回复。

一个智能体确实可以尝试全做。但实践中,你把越多职责堆进一个智能体,它就越脆弱。最后往往是:单步输入的上下文过多、单个组件可用的工具过多、可预测性变差、可治理性变差、调试难度剧增。系统或许还能"跑起来",但变得难以信任。

更清晰的模式:一个主智能体,几个专注的子智能体

更干净的设计是这样的:主智能体 → 专业子智能体 → 最终结果。

主智能体掌控整个工作流。它的任务是理解请求、决定需要做什么、把具体工作分派出去、然后整合结果。子智能体各专一事。比如:检索子智能体负责获取准确的上下文信息,政策子智能体负责核对规则或权限,分析子智能体负责推荐下一步,执行子智能体负责处理已批准的下游操作,沟通子智能体负责起草最终消息。

打开网易新闻 查看精彩图片

这比让一个宽泛的智能体一次性做完所有事要健康得多。

为什么这个模式更有效

第一个原因很直接:专注。检索子智能体只管检索,政策子智能体只管政策,执行子智能体只管执行。你不用强迫一个组件同时 juggling 太多职责。

第二个原因是控制。不同子智能体可以拥有不同权限、不同工具、不同的运行边界。这在企业系统里好管得多。

第三个原因是可观测性。如果结果不对,你更有机会定位问题所在:是检索错了,还是政策理解偏了,还是执行环节出了问题。