一个悖论正在硅谷蔓延:智能体(AI Agent,能自主执行任务的AI系统)接管了更多工作,但所有人都在抱怨"从未如此忙碌"。Notion的工程师重新开始通宵达旦,不是因为训练模型,而是因为"智能体层的token焦虑"。这到底是怎么回事?

本期AINews记录了2026年4月3日至4日的行业动态。我们扫了12个Reddit板块、544个Twitter账号,没有新Discord。以下是从中提炼的关键信号。

打开网易新闻 查看精彩图片

谁在焦虑:从Levie到Cowen的三重观察

Box CEO Aaron Levie(播客常客)的观察最直接:"AI目前没有让任何人减少工作量,硅谷的团队感觉比以往任何时候都忙。"

经济学家Tyler Cowen从另一个角度切入:无论你认为AI会贬低还是提升你的价值,现在都应该更拼命工作。这不是鸡汤,是博弈论——在价值重估的窗口期,位置比预测更重要。

Notion工程师Simon Last的坦白最具体。他上一次通宵是放弃机器学习模型训练的时候,现在卷土重来,原因是"智能体层的token焦虑"。翻译一下:当AI能自动调用工具、执行多步骤任务时,工程师担心的不再是模型本身,而是编排这些行为的成本、延迟和不可预测性。

三个人,三个层面:团队负荷、个人策略、技术债务。共同点是"更忙",而非"更轻松"。

火鸡问题:历史数据会欺骗你

AINews作者抛出一个思想实验:火鸡根据毕生经验——人类每天喂食、环境舒适——会得出"人类是为火鸡福祉而存在"的结论。唱衰者是危言耸听的怪人。直到感恩节。

知识工作者是火鸡吗?我们的"工作弹性"和价值曲线,会不会在某一交叉点后突然断崖——像马匹被内燃机取代那样?

这个担忧有数据支撑。SWE-Bench(软件工程基准测试)已被"饱和",其进阶版SWE-Bench Pro即将步后尘。Claude Mythos内部使用两个月,已达78%。GDPval给GPT 5.4的评分是:在大多数经济领域,83%的情况下等于或优于人类专家。

但矛盾的是:模型实验室和智能体实验室的生产力创历史新高,收购和人才并购却比以往更激进。如果终点已知,为什么还在加速奔跑?

两条逃生路线:新考试与新硬件

行业正在押注两个方向。

方向一是更难的问题。Notion正在开发"Notion's Last Exam"——字面意思是最后一考,暗含终局意味。Google DeepMind的Greg Kamradt和François Chollet推出了ARC-AGI-3,延续他们标志性的抽象推理挑战。AINews团队自己也在推进下一代编程评估。

方向二是硬件宿命论。如果AGI(通用人工智能)可预测地需要20吉瓦超级集群,那么当前所有软件层面的竞赛都只是前奏。算力即命运。

但作者留下一个开放式追问:真的只剩下这两条路线吗?有没有更有价值的问题被忽视了?

本周产品信号:浏览器智能体与3D世界模型

Google Chrome的"Skills"功能值得拆解。它让用户把Gemini提示词保存为可复用的浏览器工作流——一键对当前页面和选中标签执行操作。Google还提供了预制Skill库。

这不是提示词历史记录,是轻量级的终端用户智能体化。关键设计选择:留在浏览器内,而非另起炉灶。对25-40岁的科技从业者来说,这意味着工作流自动化正在从"开发者工具"下沉为"浏览器原生功能"。

腾讯的HYWorld 2.0则展示了另一条路径。Dylan Wang提前披露:这是一个开源的、引擎就绪的3D世界模型,单图生成可编辑的3D场景。定位很刻意——不是视频模型,是"可编辑的3D场景生成器"。

视频生成已经拥挤,但"生成即资产"的3D管线还有工程空间。对于需要快速原型、游戏资产或空间计算内容的团队,这省掉的是从概念到可迭代文件的天数。

Google DeepMind本周还有另一项发布,但原文信息在此处中断。我们按规则不补全。

最后的基础设施注脚:AINews已并入Latent Space,邮件频率可选。网站支持历史检索。