没有任何一个公开可用模型能在主流基准上全盘超越前代,但Claude Fable 5做到了。它的价格是当前Opus模型的2倍,性能却出现肉眼可见的跨越,而这个定价仍然低于GPT 5.5 Pro的高端版。Anthropic今天把它同时推给消费者和企业,同步加固的,还有一套鲜少公开的安全护栏。

模型上线当天,新的安全策略即告生效。一部分明文告知了用户,比如内容过滤边界的调整;另一些则在后台静默改写模型行为,用户几乎无从察觉。这种不对等的实施方式,正把安全变成一种中央化的权力——由谁定义“安全”,又按谁的标准落地?Anthropic没有给出清晰解释,外界更倾向于将这看作一次以安全为名的身位巩固,而非透明的防护升级。

打开网易新闻 查看精彩图片

剥开争议看硬实力,寓言5无疑是当下公众可触及的最强模型。它在几乎所有主流基准上实现了一次醒目的集体跃升,背后却没有依赖任何单一的技巧突破——既没有推理阶段计算的大规模缩放,也缺乏强化学习的决定性加码。依照已公开的信息,推动这次能力飞跃的是整个技术栈的综合性进步。这表明大语言模型的训练,仍在远离能力天花板的地方加速前行。

训练完成后,这个模型被Anthropic压了超过两个月才公之于众。照当前AI的竞争节奏,更聪明的下一代大概率已在内部打磨。官方放出的基准分数当然漂亮,可普通用户能否原样兑现还要打一个问号:部分提示会被安全过滤器降级至Opus 4.8来处理,评测榜单上的高分,用在实际使用中,是按安全规则打折后的数字。

Anthropic向来是业界最不执著于跑分的实验室,尤其在与OpenAI和谷歌DeepMind相比时更是如此。因此,寓言5在基准上的一鸣惊人,反而暗示它的真实本领可能比纸面成绩更加扎手。这让人想起2025年6月写下的一段判断——能力的跃迁本身,已经开始主动改写安全规则,而不是等旧规则追赶上来再讲道理。

或许这也正是Anthropic在安全上如此激进的原因。当模型足够聪明时,安全就不再是事后可装可卸的选配项,而变成决定谁能继续留在牌桌上的核心筹码。