来源:探索AGI
上个周A➗的开发者大会,视频陆陆续续出炉了。 这一次可以说是一场Agent大会,基本都在围绕,如何做好Agent,如何发挥模型极限价值。
Anthropic虽然现在搞得自己名声不咋地,但是分享的实战经验是实打实的。
今天分享一个很有意思的主题,关于多智能体的。我把几场分享相关的内容都结合到一起来看,发现Agent也在经历人的组织管理的一些事情。
故事先从Omni CTO的分享开始。 Omni是一家做AI分析的公司,25个工程师做了一个叫Blobby的Agent,用户问问题,Blbby找到合适的结果返回给用户。 18个月,进化了好几个版本,现在可以自己拆任务、自己纠错、自己选工具,像真正的数据分析师一样。
直到有一个,CEO问了Blobby一个问题,Blobby给了一个离谱的答案。
CEO立马找到团队说:go fix it. 开发团队回复:LLM有不可预测性,有时候就是会犯错。CEO说了一句话:Not good enough. Go fix it.
这个故事太有共鸣了,在我的工作里边,真的每天都在现实上演,但真正有意思的是这个故事的后续。
当CEO反复要求 go fix it,团队认真去读模型的推理traces。
去研究模型每一步决策的思考过程,理解它为什么做这些决策,然后他们发现了问题的根源。
Blobby的架构是这样设计的:一个外层Agent负责理解用户问题、拆解任务列表;一个内层Sub-Agent专门负责生成数据查询。典型的多Agent,各司其职的架构。
问题出在:外层Agent不知道内层Agent能做什么。
外层Agent可能说:把GitHub PR数据和客户支持数据合并起来分析一下。 但是内层Agent回答:我单次查询做不到这件事,需要跑多次。
然后整个对话就开始跑偏,Agent都没有问题,外层Agent根据用户问题做了合理的拆解,内层Agent也如实报告了自己的限制。问题在于:它们对彼此能力边界的认知是断裂的。
他们把这个现象取了个名字叫:Split Brain。精神分裂。 修复策略叫Blobotomy——Blobby + Lobotomy(脑叶切除术)。
很黑色幽默。。。
修复方案特简单:把内层Agent的工具直接上提到外层Agent中,消除中间层。一个Agent同时拥有“理解问题”和“生成查询”的全部能力。
结果是,大量看似随机、不可预测的错误消失了。复杂场景的评测分数大幅提升。
将这些东西的时候,虽然Chris的语气很平静,但你能感觉到他在说一个教训:Agent的不可预测,很多时候不是模型的问题,是架构的问题。而架构问题,用读traces的方式,是可以找到的。
同样的问题,不同的解法
另一个分会场,Anthropic Applied AI团队的Ash讲了另外一个故事,症状是一致的,原因不同。
他们在尝试让Claude连续跑好几个小时,构建完整的应用,架构里有三个角色:Planner(做高层规划)、Generator(写代码和构建)、Evaluator(打分和测试)。
问题来了,如何做好打分,以及打分之后的迭代闭环?
如果你让同一个Agent自己写代码又自己评价自己的代码,会怎样?
Out of the box, Claude is a really, really bad general QA agent.
因为LLM天然有sycophancy bias,讨好倾向。让它评价自己的产出,就像让一个员工自己给自己评价绩效,什么都是超预期的。
但如果用2个角色,一件有趣的事就发生了:调教一个独立的critic让它变严格,其实非常容易。调教一个builder让它自我批评,几乎不可能。
举个例子:我们自己去评价一道菜好不好吃、评价一个短视频好不好看,很容易。 但是你让我去把菜做出来,把视频拍出来,那就是另外一回事了。
评价能力和创造能力之间有一个天然的gap。
角色分开只是第一步,新问题是:Generator和Evaluator对“做完”的定义不一样怎么办?
这就是Ash团队提出的解法,在动手之前,先协商签订协议。
Generator开工写代码之前,它和Evaluator要先谈判。Evaluator可能会说: 你范围定大了,你的测试标准太松了,你漏掉了某个边缘场景。
两个Agent通过文件系统来回交换意见,一个写markdown,另一个读、批注、回复,直到双方达成一致。
然后Generator开始建造,而Evaluator根据前面讨论的协议来打分。
If you have vague criteria, you have vague critiques, the generator just shrugs and does things.
如果标准模糊,反馈就模糊,builder就耸耸肩继续做。
到这里,我开始觉得这件事真正有意思的地方,不在技术。
我看了这2场之后,脑子只在想: 如果我把“Agent”这个词换成员工,把Planner换成产品经理,把Generator换成开发工程师,把Evaluator换成测试工程师,几乎分不出这是在讲AI架构设计还是在讲公司管理。
管理的人不了解下属能力边界 → 指令与执行脱节。 这是很多企业都有的问题。
让员工自己评价自己 → 永远是超预期。这也是绩效管理的经典问题。
开工前先对齐DoD(Definition of Done)→ 产出质量可控。 这是敏捷开发社区喊了20年的事情。
甚至解决方案都类似。Omni说的 Consolidating the Brain,把工具上提,减少层级,这不就是组织扁平化吗?
Anthropic的先商讨协议,这不就是sprint planning里对齐验收标准吗?
所以,Agent似乎在重演人的组织形式。
Anthropic给过一个说法,翻译是:仔细看,PM,IC,QA的组织架构,我们没发明什么新东西,只是给每个角色分配了适合自己的Context。
If you squint at this, this is just a very simple PM, IC, and QA org structure. We didn't invent this, we just gave each role its own context window.
这句话背后其实有个判断,Agent系统的协作难题,不是AI特有的问题。它是任何分布式系统,无论节点是人还是AI,都必须面对的基本问题:
信息不对称:谁知道什么?谁不知道什么?
能力边界:每个角色能做什么、不能做什么?
标准共识:什么叫“做完了”?
协调成本:层级越多、角色越多,对齐成本越高。
人类社会花了几千年来发展组织理论和管理学,本质上就是在回答这些问题。Agent系统花了18个月,跑到了同样的路口。
随着模型变强,有些问题会消失,新的问题会出现。 这跟人类组织的演进一模一样,公司从10人到100人到1000人,管理的挑战不会消失,它只是换了形态。10人时的问题是“谁干什么”,100人时变成“部门怎么协调”,1000人时变成“信息怎么流通”。
Agent架构也是如此。今天是split brain,明天模型更强了,可能不需要拆成outer agent和sub-agent了。但新的协调问题一定会出现——可能是跨Agent的记忆一致性,可能是多Agent同时修改同一份文件时的冲突。
管理问题不会被AI消灭。AI会让管理问题以新的方式复活。
参考地址:
Anthropic Applied AI分享:https://www.youtube.com/watch?v=mR-WAvEPRwE
Omni CTO分享: https://www.youtube.com/watch?v=K4-flzsPraE
阅读最新前沿科技趋势报告,请访问21世纪关键技术研究院的“未来知识库”
未来知识库是 “21世纪关键技术研究院”建 立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。
截止到2月28日 ”未来知识库”精选的百部前沿科技趋势报告
(加入未来知识库,全部资料免费阅读和下载)
热门跟贴