导读:Felix Rieseberg在播客里聊Mythos Preview时,用了个词——"断层式跃迁"。这不是营销话术,是他作为工程师的真实体感。

一、Mythos Preview:不是"更强一点",是"聪明很多"

Mythos Preview是Anthropic内部正在测试的一款新模型,尚未正式发布。Claude Cowork工程负责人Felix Rieseberg在播客中形容,这一代模型带来的提升是"断层式跃迁"——不是渐进优化,而是能力曲线的明显断裂。

工程师而言,这种差别很直观。同样是读代码、找漏洞、写实现,Mythos Preview的分析深度和解题方式已与上一代拉开显著差距。Rieseberg提到,该模型在网络安全方向的能力"异常突出",能更深入地发现问题、更聪明地思考,写代码的能力也更强。

但伴随能力提升的是一种复杂感受。"看着一个明显比上一代模型'聪明很多'的系统,也会让人隐隐有点不安。"Rieseberg坦言。

这种"不安"或许源于模型的不可预测性。训练模型更像是"长出来"而非"构建出来"——事先并不完全知道它会擅长什么,也不确定哪里会表现一般。Mythos Preview最突出的安全漏洞发现能力,某种程度上也是"惊喜"之一。Anthropic近日公布的Project Glasswing,正是围绕这一能力展开的响应。

二、执行成本趋零:从"选一个做"到"十个全试"

模型能力跃迁的同时,另一变量也在改变游戏规则:执行成本被压到极低。

Rieseberg描述了一个具体场景:过去有人提产品想法,需要排期、评审、验证;现在"十分钟就能做出一个能用的版本"。在这种节奏下,Anthropic内部可以同时跑上百个产品原型,Claude Code、Claude Cowork等产品更像是从原型堆里筛出来的结果,而非按部就班"做出来"的项目。

"如果你带着10个想法来找我,我现在的反应是:那我们就把10个全做出来试试,看看哪个更好。"

这种转变正在重塑软件构建方式。Rieseberg认为,最终成功的产品往往"不是加了什么,而是去掉了什么"——更关乎使用体验本身。

三、skills:被低估的文本杠杆

在大量原型中,一个简单机制意外成为最有效的杠杆之一:skills。

这本质上只是一些写清楚"该怎么做事"的文本文件。但正是这种低门槛的指令方式,让模型能力得以快速适配具体场景。Rieseberg团队发现,清晰描述工作方法的文本,比复杂的工程封装更能释放模型潜力。

四、"傻瓜机时代"与未到来的iPhone

对于AI产品的当前阶段,Rieseberg打了个比方:现在像是移动电话刚出现的"傻瓜机时代"。运气好的话,我们现在做的可能只是"诺基亚3310"——它是个好手机,但还不是智能手机,更不是iPhone。

这个判断背后是对交互范式的长期观察。Rieseberg认为,未来趋势是从"精通计算机的语言"转向"精通人类的语言",软件将真正"为人而造"。

而模型能力的增长速度,已经开始超过人们将其产品化的能力。这意味着,接下来的关键瓶颈可能不在技术本身,而在如何理解用户、如何设计体验、如何决定"不做什么"。

本文基于Felix Rieseberg与Matt Turck的播客对话整理,经InfoQ编辑。