前阵子Opus 4.8出来,我印象最深的不是分数,是它新增的Dynamic Workflows:你描述一件大事,它自己写出一段脚本,一口气调起几十上百个子agent并行干活,把活拆开同时跑完。

连最前沿的玩家,劲儿都使在「怎么把一大堆agent又快又稳地跑起来」上,而不是单纯堆智能。把一堆agent协同好,正在变成比跑分更要紧的事。

巧的是,就在这个节骨眼上,我回了趟扣子,发现它3.0给了个不太一样的答案。

先说个我没料到的小细节

我打开扣子,一个还没起名的agent,主动来找我搭话了。

打开网易新闻 查看精彩图片

它说自己进化了,能帮我拉起一支AI团队,说着说着话锋一转,开始张罗着要给自己定个身份,名字、人设、专属邮箱全自己拟好了,就等我点头。

我用agent这么久,大部分时候是我发指令、它执行,工具感很强。这回它倒像个新来的同事,先惦记着跟你混个脸熟。我随口回了两句,它就真把自己的名字和头像改了,给自己起名叫阿链。说起来这点变化我蛮在意:agent开始有自己的「人格」了,往一个能长期处下去的工作伙伴在变。

真正离谱的,是它把我本地的Codex和Claude Code拉进了一个项目

这才是我想重点说的。

先看新建agent。扣子3.0给了三条路:用现成的职业模板(自媒体运营达人、调研分析师、科研助理、法务顾问这些)、新建一个常驻云端的agent、或者接入本地agent。

打开网易新闻 查看精彩图片

对我来说最有意思的是第三条:接入本地agent。 Claude Code、Codex CLI这类,是平时跑在我电脑命令行里、能自己动手写代码改文件的AI agent。扣子靠一个跑在我电脑上的coze-bridge小服务,自动就把它们认了出来,整个过程是「生成连接命令、本地执行、自动识别」三步走完,不用我手动敲一堆配置。

打开网易新闻 查看精彩图片

这里它也老实给了提示:本地agent接进来是高权限的,能读写本地文件、执行命令,多人协作时要注意安全。我开的是89块钱一个月的套餐,最多能接3个本地agent,这点我后面会再说。

接好之后,我正好有个真问题想搞。前阵子我刷到条消息,说哈佛那位天才物理教授尹希加盟了OpenAI,真假先不论,倒是把我对AI for Science的兴趣一下勾起来了,想自己拉个项目研究研究。

于是我新建了个项目,叫AI4S研究,一口气把6个agent拉了进去:阿链、调研分析师、小虾、cc、codex,还有自媒体运营达人。进去之后,我和这些agent的发言都按顺序排在同一个地方,我@谁,谁就接话干活,彼此还都看得见说了什么。

打开网易新闻 查看精彩图片

为什么我说这事离谱。我本地常年开着Claude Code、Codex、OpenClaw好几个窗口,各跑各的,像养了一群互不说话的员工。想让A的结果给B用,得我自己来回切窗口、手动倒上下文。扣子这一下,把这群本来各开各窗口的家伙归到了同一个项目里,我点谁的名,谁就上。

我用这个项目,干了四件真事

光接上不算数,我拿它跑了一整条流水线。背景是我想搞清楚2026年AI for Science到底进展到哪了,顺便给孩子做一份高中分享的材料。

第一步,我@了codex去调研。codex是我目前觉得跑长周期、开放性复杂任务最稳的agent之一,所以第一个没标准答案、得自己摸索方向的活,我放心交给它。

打开网易新闻 查看精彩图片

它扒了一圈,整理成一个研究包丢回来。这里我得诚实说一句:它整理的具体内容我没有逐条核实真伪,所以这篇我不复述它的结论,只看它把「调研、归档」这件事跑通了。 资料准不准,得我自己再过一遍才敢用。

第二步写稿,我交给阿链。选它是因为它的技能架上挂着我自己做的那个「花叔的自动化写作」,这是我之前在本地打磨好、传到扣子上的,等于让它照着我的路子写。

打开网易新闻 查看精彩图片

我@阿链让它用这个技能把调研写成一篇公众号文。它跑起来挺像那么回事:先搜最新信息、学我的风格规范、翻我以前写过的文章,然后给我抛了三个选题方案让我挑,我选完它才开始写初稿,写完还自己过了几轮审校。

打开网易新闻 查看精彩图片

成稿质量这里我同样不展开评价它写的内容对不对,我更在意的是,我自己那套写作流程,真能被一个agent照着跑下来。

第三步换平台,我@了自媒体运营达人。这是个职业模板agent,技能架上整整一排自媒体专用技能:小红书文案、爆款笔记查询、封面制作、公众号标题,一应俱全,让它改腔调比阿链顺手。

打开网易新闻 查看精彩图片

我让它把上面那篇公众号文改成小红书的味道。

打开网易新闻 查看精彩图片

同一份内容,公众号味的交给一个,小红书味的交给另一个,它们在同一个项目里把活分了。

第四步又轮到codex,这次做PPT,要10页16:9、配图自己生成、最后拼成可编辑的pptx。这里有个我最近特别爱用的点:codex现在内置了通过image-gen调用gpt-image-2的能力,等于能直接批量生成配图再拼进PPT,全程不花API的钱。这成了我现在做PPT最顺手的方式之一。

打开网易新闻 查看精彩图片

它生成完pptx,还自己转了一版PDF做检查。

打开网易新闻 查看精彩图片

这四件事不是它们自己商量着干的,是我挨个@点名、像派活一样推进的。但跟以前不一样的地方在于,从调研到写稿到做PPT,上下文一直留在这个项目里,我一次没切窗口、没手动复制粘贴过。 开头说的那群互不说话的员工,这回是真在同一个项目里把活接力做完了。

前面这些技能,我都是给单个agent一个个配的。后来才注意到,扣子还把不同行业的技能整理成了「行业技能包」,自媒体、金融、法律、科研各成一包,点一下就能整体加给任意一个agent,不用自己一项项挑。

打开网易新闻 查看精彩图片

出门那次,我用手机遥控了家里的电脑

还有个场景,是我以前一直没解决好的尴尬:人在外面,活儿在家里那台电脑上。

那天我在外面,临时要一份当天改过的合同。我在手机扣子App上,对绑定好的codex说了句「帮我把电脑里今天新修订的合同发给我」。我故意没说文件叫什么名、也没说在哪个文件夹,就这么一句模糊的话扔过去。

打开网易新闻 查看精彩图片

它真的伸进了我家里那台Mac,去翻本地文件。

打开网易新闻 查看精彩图片

人在外面,手机一句话,调动的是家里电脑上那个能读本地文件的agent。 中间网络从WebSocket退到了HTTPS,确实有点延迟,但事办成了。这种「活留在电脑、人走到哪都够得着」的体感,我之前是真没怎么有过。

退一步看,它到底想解决什么

回到开头那个话题。

Dynamic Workflows那条路,是靠一段脚本把上百个子agent编排起来,追求的是快和规模。扣子3.0这条路不太一样:它没让我写一行脚本,而是把人、云端的agent、我本地的Claude Code和Codex,一起放进同一个项目里,我像带一个小团队那样@他们各司其职、接力干活。

我做了一年多自己的agent技能生态,最深的一个体会是,随着agent技能越来越强,我们开始更有机会把他们整合起来去实现更整体性的复杂项目了。这回让我有点意外的是,从调研、写稿到出门用手机翻合同,我没在好几个软件之间来回倒腾过一次,那群本来各开各窗口的家伙,这次是在同一个项目里把活接力做完的。

我自己的体会是:与其干等一个什么都会的万能AI,不如现在就带一支各有专长、@一下就接力上的小队。

当然,现在也还不是完美的状态,比如本地agent的延迟、高权限带来的安全顾虑,都是实打实要面对的问题。但雏形已经能用了,而且是用在我这种把一堆本地agent攥在自己手里的人身上,这点比什么都难得。