你有没有遇到过这种同事:永远在等指令。你不说下一句话,他就趴在桌上不动。做完第一步不检查,搞砸了也不复盘。
过去所有的AI助手,几乎都是这个德性。
但现在,Anthropic要把它们全部改造成——自己领任务、自己检查作业、半夜偷偷复盘涨经验的“数字卷王” 。
就在昨天的Code with Claude开发者日上,这家公司一口气甩出了三颗重磅炸弹:Managed Agents托管服务,以及附在其上的两个核心功能——Outcomes Loop(结果闭环)和Dreaming(梦境) 。
不少开发者看完惊呼:人类审核这个最大的任务瓶颈,要被彻底绕过去了。

打开网易新闻 查看精彩图片

一、从“传话筒”到“领任务的人”:告别一句话一挪步的尴尬
先来看现状。以前的AI,再聪明本质上也只是一个“高级传话筒”。
你发一段代码让它改,它改了。你给它扔一个需求“帮我分析财报”,它先问“您要什么维度的?”每一步都需要你推一下,AI才动一下。
这种“一句话一挪步”的模式,堵死了大规模应用AI的路。人不可能二十四小时盯着聊天窗口去下单子。
这次升级的核心,就是打破这个僵局。Anthropic强调,Managed Agents让AI不再只是等待提示词的代码助手,而是能接收高层级目标、自动执行多步骤计划、并在执行完成后评估结果的智能体系统。
说白了,你把任务目标说清楚——比如“优化这个网页的加载速度”,AI就可以在自己云端的小隔间里搞定状态持久化、错误重试、资源隔离等一系列脏活累活。全程不需要你去充当那个“黏合剂”。根据官方说法,开发者构建和部署可扩展智能体的速度,据称提升了10倍。
二、最强升级:Outcomes,给自己请了一个“冷酷无情的监工”
如果说托管服务给AI配了个“干活的环境”,那Outcomes函授就是给它配了一个“全场最丧心病狂的质检员” 。
怎么操作?你只需用自然语言写下一条非常细的评分标准。
比如,“发给客户的邮件标题必须包含日期”、“回复必须不超过200字且情绪积极”。AI完成工作后,系统里一个完全独立的评分智能体出动了。它在一个隔绝的上下文里,冷冰冰地盯着输出,对照标准逐项打分。
这个评分员和干活AI是隔开的,所以不受干活AI任何主观理由的干扰——不会听到它找借口“虽然格式不对但我觉得效果不错”。
没达标怎么办?简单,评分员直接指出具体哪一条没满足,把作业甩回来。干活的AI乖乖修改,修改完评分员再判,直到及格为止。Anthropic的实测数据很说明问题:相比标准提示词循环,Outcomes让任务成功率最高提升了10个百分点,docx文档生成质量提高了8.4% ,pptx提高了10.1%。
越难的任务,这套机制的助攻效果越猛,甚至可以用来判断“文案语气符合品牌调性”这种比较主观的标准。
三、最科幻的“卷王”日常:梦里还在加班查漏补缺
不过Outcomes再牛,它解决的还是“单次”任务的质量。
那AI做过成百上千个任务后,能不能自己从中总结出规律、下次做得更快?
这就引出了这次最出圈的功能——Dreaming(梦境) 。
这个名字起得非常诗意,但技术意图极其明确。AI不是在真正睡觉,而是在任务间隙,后台自动翻阅一个巨大的“历史作业本” 。
具体来说,这个异步任务会读取现有记忆库和最多100个历史会话的所有细节,然后干三件事:合并重复项、用最新信息替换过期内容、在多个Agent的会话中交叉比对找出隐藏模式和团队偏好。
举个例子。一个AI老是把某个同事的沟通风格搞错,读了一百次会话后发现“哦,原来这位同事习惯列123点”。于是这个规律写进新记忆库,下次直接套用。
一个Agent的独自经历会发现不了这个规律,但多个Agent的历史放一起交叉分析,规律就浮出来了。法律科技公司Harvey接入了这个“梦境”功能后,长文法律文书起草的任务完成率涨了约6倍。
我们得仔细算算这笔人力账:以前的企业教会一个新人懂规则流程,可能需要几次周会、十几份文档、至少一周的磨合。现在Dreaming让AI打工人在零点至凌晨两点,自己调取几百份日志,挖出重复犯错的点,直接塞进记忆库里,第二天上班直接变强。
四、最后的问题:我们准备好给AI发“绩效工资”了吗?
这场发布会的冲击波,远不止于功能本身。创始人Dario Amodei在现场强调了那个著名的预测—— 首家由一人+AI运营、估值达到10亿美金的公司,将在2026年诞生,距离现在只剩不到八个月。
在这个逻辑下,公司不再需要庞大的中间管理层。谁能清晰定义目标和评估标准,谁就能调度一支全天候运转的AI团队。人的角色正在从“发号施令”转向“设定游戏规则”。
但硬币总有另一面。
如果智能体能在云端独立完成绝大多数工作任务,那些曾经依赖“纯人工审核”的岗位会被快速压缩。如果你的工作只是今天写个报告草稿明天催个进度汇报,那可能很快就能看到一个永不休息、自我迭代、毫无怨言的对手上线。
更让人心头一紧的问号浮出水面:当AI学会了自己考核自己、自己给自己涨经验后,那个原本坐在工位中间负责派活的“我”,还能剩下多少价值?
AI不是变聪明了,AI是变完整了。