当一家AI公司说"没有自助注册"时,它真正在说什么?Anthropic最新发布的Claude Mythos Preview,表面上是模型更新,实际上是一场关于"谁能进门"的压力测试。首批名单里的11个名字——AWS、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金会、微软、英伟达、Palo Alto Networks——已经画出了未来十年的权力地图。

一张门票,两种读法

一张门票,两种读法

这份名单的有趣之处不在谁在里面,而在谁被挡在外面。没有OpenAI,没有Meta,没有任何初创安全公司。Anthropic说这是"防御性网络安全研究预览",但防御的定义权显然已经移交给了特定的俱乐部。

模型的能力本身足够让门外的玩家焦虑。Anthropic披露,Mythos Preview能自主识别并利用零日漏洞,对闭源软件进行逆向工程,还能把已知漏洞转化为可用攻击代码。一个具体案例:它在FreeBSD中发现了一个远程代码执行漏洞,获得了服务器的完全控制权。

更刺眼的数据是"超过99%的漏洞尚未修复"。这不是在炫耀技术,是在解释为什么门要焊死——如果漏洞披露速度超过补丁速度,开放访问等于集体自杀。

安全悖论:越危险,越封闭

安全悖论:越危险,越封闭

这个逻辑链条几乎无懈可击。模型越强,风险越高;风险越高,访问越受限;访问越受限,验证和制衡越少。Anthropic把自己架在了一个微妙的位置:它既是守门人,又是唯一被允许评估门内风险的人。

Project Glasswing的命名本身就很说明问题。玻璃翅膀是美丽的,也是脆弱的。这个隐喻大概不是随便选的——透明度和易碎性被绑在了一起。

但问题在于,"防御性用途"的边界谁来画?同一份技术能力,在摩根大通手里是金融基础设施防护,在另一套语境下可能就是别的用途。Anthropic的声明里反复出现"自主"这个词:自主识别、自主利用、自主执行。自主性越高,人类监督的窗口越窄,"防御"与"攻击"之间的灰色地带就越模糊。

门缝里的光

门缝里的光

Linux基金会的出现是名单里唯一的非企业实体。这可能是一个信号——开源社区被允许在玻璃房子里旁观,但能不能参与决策,是另一回事。

更值得玩味的是时间节点。Mythos Preview的发布恰逢AI安全辩论的白热化阶段。OpenAI的o3在编码基准测试上刷新纪录,DeepSeek以极低成本逼近前沿性能,整个行业都在重新计算"能力"与"控制"的汇率。Anthropic选择此时推出一个"不开放"的模型,像是在用极端案例测试监管和舆论的底线。

「这不是一个正常的发布。」Anthropic自己的措辞毫不掩饰。但"非正常"正在成为新常态。从GPT-4到Claude 3.5,再到今天的Mythos,前沿模型的访问曲线明显在向下弯曲——不是技术民主化的向下,而是准入门槛的向上。

谁为门外的世界负责

谁为门外的世界负责

11家机构获得的不是产品,而是优先知情权。在漏洞经济里,时间差就是一切。知道得越早,防御部署越快,或者……其他选项也越充分。

Anthropic的赌注很清楚:如果Mythos真的能找到人类专家遗漏的漏洞,那么封闭就是负责任的选择。但这个论证有个漏洞——它假设门内的11家机构会共享发现、协调披露、优先考虑公共利益。历史记录并不完全支持这个假设。

更现实的画面可能是分层响应:核心成员第一时间获得完整信息,外围成员拿到摘要,公众在补丁发布后才知道曾经暴露在什么风险中。这不是阴谋论,是现有漏洞披露机制的日常操作。

门已经铸好了。形状是Anthropic设计的,材料是"安全"这两个字。现在的问题是:当99%的漏洞都还在暗处时,我们应该更担心模型本身,还是更担心决定谁能看到模型的人?