为什么AI越能干，工程师反而越累？|大模型|工作流|工程师|智能体|浏览器|知名企业|谷歌

一个悖论正在硅谷蔓延：智能体（AI Agent，能自主执行任务的AI系统）接管了更多工作，但所有人都在抱怨"从未如此忙碌"。Notion的工程师重新开始通宵达旦，不是因为训练模型，而是因为"智能体层的token焦虑"。这到底是怎么回事？

本期AINews记录了2026年4月3日至4日的行业动态。我们扫了12个Reddit板块、544个Twitter账号，没有新Discord。以下是从中提炼的关键信号。

谁在焦虑：从Levie到Cowen的三重观察

Box CEO Aaron Levie（播客常客）的观察最直接："AI目前没有让任何人减少工作量，硅谷的团队感觉比以往任何时候都忙。"

经济学家Tyler Cowen从另一个角度切入：无论你认为AI会贬低还是提升你的价值，现在都应该更拼命工作。这不是鸡汤，是博弈论——在价值重估的窗口期，位置比预测更重要。

Notion工程师Simon Last的坦白最具体。他上一次通宵是放弃机器学习模型训练的时候，现在卷土重来，原因是"智能体层的token焦虑"。翻译一下：当AI能自动调用工具、执行多步骤任务时，工程师担心的不再是模型本身，而是编排这些行为的成本、延迟和不可预测性。

三个人，三个层面：团队负荷、个人策略、技术债务。共同点是"更忙"，而非"更轻松"。

火鸡问题：历史数据会欺骗你

AINews作者抛出一个思想实验：火鸡根据毕生经验——人类每天喂食、环境舒适——会得出"人类是为火鸡福祉而存在"的结论。唱衰者是危言耸听的怪人。直到感恩节。

知识工作者是火鸡吗？我们的"工作弹性"和价值曲线，会不会在某一交叉点后突然断崖——像马匹被内燃机取代那样？

这个担忧有数据支撑。SWE-Bench（软件工程基准测试）已被"饱和"，其进阶版SWE-Bench Pro即将步后尘。Claude Mythos内部使用两个月，已达78%。GDPval给GPT 5.4的评分是：在大多数经济领域，83%的情况下等于或优于人类专家。

但矛盾的是：模型实验室和智能体实验室的生产力创历史新高，收购和人才并购却比以往更激进。如果终点已知，为什么还在加速奔跑？

两条逃生路线：新考试与新硬件

行业正在押注两个方向。

方向一是更难的问题。Notion正在开发"Notion's Last Exam"——字面意思是最后一考，暗含终局意味。Google DeepMind的Greg Kamradt和François Chollet推出了ARC-AGI-3，延续他们标志性的抽象推理挑战。AINews团队自己也在推进下一代编程评估。

方向二是硬件宿命论。如果AGI（通用人工智能）可预测地需要20吉瓦超级集群，那么当前所有软件层面的竞赛都只是前奏。算力即命运。

但作者留下一个开放式追问：真的只剩下这两条路线吗？有没有更有价值的问题被忽视了？

本周产品信号：浏览器智能体与3D世界模型

Google Chrome的"Skills"功能值得拆解。它让用户把Gemini提示词保存为可复用的浏览器工作流——一键对当前页面和选中标签执行操作。Google还提供了预制Skill库。

这不是提示词历史记录，是轻量级的终端用户智能体化。关键设计选择：留在浏览器内，而非另起炉灶。对25-40岁的科技从业者来说，这意味着工作流自动化正在从"开发者工具"下沉为"浏览器原生功能"。

腾讯的HYWorld 2.0则展示了另一条路径。Dylan Wang提前披露：这是一个开源的、引擎就绪的3D世界模型，单图生成可编辑的3D场景。定位很刻意——不是视频模型，是"可编辑的3D场景生成器"。

视频生成已经拥挤，但"生成即资产"的3D管线还有工程空间。对于需要快速原型、游戏资产或空间计算内容的团队，这省掉的是从概念到可迭代文件的天数。

Google DeepMind本周还有另一项发布，但原文信息在此处中断。我们按规则不补全。

最后的基础设施注脚：AINews已并入Latent Space，邮件频率可选。网站支持历史检索。