一个模型让Anthropic工程师"有点不安"|anthropic|preview|人工智能模型|代码|工程师

导读：Felix Rieseberg在播客里聊Mythos Preview时，用了个词——"断层式跃迁"。这不是营销话术，是他作为工程师的真实体感。

一、Mythos Preview：不是"更强一点"，是"聪明很多"

Mythos Preview是Anthropic内部正在测试的一款新模型，尚未正式发布。Claude Cowork工程负责人Felix Rieseberg在播客中形容，这一代模型带来的提升是"断层式跃迁"——不是渐进优化，而是能力曲线的明显断裂。

对工程师而言，这种差别很直观。同样是读代码、找漏洞、写实现，Mythos Preview的分析深度和解题方式已与上一代拉开显著差距。Rieseberg提到，该模型在网络安全方向的能力"异常突出"，能更深入地发现问题、更聪明地思考，写代码的能力也更强。

但伴随能力提升的是一种复杂感受。"看着一个明显比上一代模型'聪明很多'的系统，也会让人隐隐有点不安。"Rieseberg坦言。

这种"不安"或许源于模型的不可预测性。训练模型更像是"长出来"而非"构建出来"——事先并不完全知道它会擅长什么，也不确定哪里会表现一般。Mythos Preview最突出的安全漏洞发现能力，某种程度上也是"惊喜"之一。Anthropic近日公布的Project Glasswing，正是围绕这一能力展开的响应。

二、执行成本趋零：从"选一个做"到"十个全试"

模型能力跃迁的同时，另一变量也在改变游戏规则：执行成本被压到极低。

Rieseberg描述了一个具体场景：过去有人提产品想法，需要排期、评审、验证；现在"十分钟就能做出一个能用的版本"。在这种节奏下，Anthropic内部可以同时跑上百个产品原型，Claude Code、Claude Cowork等产品更像是从原型堆里筛出来的结果，而非按部就班"做出来"的项目。

"如果你带着10个想法来找我，我现在的反应是：那我们就把10个全做出来试试，看看哪个更好。"

这种转变正在重塑软件构建方式。Rieseberg认为，最终成功的产品往往"不是加了什么，而是去掉了什么"——更关乎使用体验本身。

三、skills：被低估的文本杠杆

在大量原型中，一个简单机制意外成为最有效的杠杆之一：skills。

这本质上只是一些写清楚"该怎么做事"的文本文件。但正是这种低门槛的指令方式，让模型能力得以快速适配具体场景。Rieseberg团队发现，清晰描述工作方法的文本，比复杂的工程封装更能释放模型潜力。

四、"傻瓜机时代"与未到来的iPhone

对于AI产品的当前阶段，Rieseberg打了个比方：现在像是移动电话刚出现的"傻瓜机时代"。运气好的话，我们现在做的可能只是"诺基亚3310"——它是个好手机，但还不是智能手机，更不是iPhone。

这个判断背后是对交互范式的长期观察。Rieseberg认为，未来趋势是从"精通计算机的语言"转向"精通人类的语言"，软件将真正"为人而造"。

而模型能力的增长速度，已经开始超过人们将其产品化的能力。这意味着，接下来的关键瓶颈可能不在技术本身，而在如何理解用户、如何设计体验、如何决定"不做什么"。