四月的那个发布日,Anthropic没有像往常那样开放新模型给开发者测试,而是拉开了一场代号“玻璃翼”(Project Glasswing)的秘密行动。当时,公司低调地写道:“我们成立Project Glasswing,是因为在新前沿模型中观察到了可能重塑网络安全的能力。”今天,这场行动正在迅速扩容——大约150家组织收到邀请,加入这个以漏洞挖掘和网络攻防为核心的内测圈层。

第一批近50家合作伙伴里,已经能看到苹果、亚马逊、博通、CrowdStrike、微软和英伟达的身影。而现在这150家新邀机构分布在超过15个国家,大部分来自此前未被充分覆盖的公共事业和医疗领域:电力、水务、电信公司以及医疗机构。这些组织的共同点是,一次成功的代码库攻击,就可能引发灾难性后果。Anthropic估算,对于多数合作伙伴,一次重大攻击波及的人数会超过1亿,对全球和国家安全造成严重冲击。

打开网易新闻 查看精彩图片

想要提前触摸Claude Mythos,组织必须先通过Anthropic的安全审核。公司强调,让这些关键基础设施机构加入,不是简单的技术尝鲜,而是基于一个判断:当前模型在发现和利用软件漏洞上的编程能力,已经超越了绝大多数人类高手。这个判断本身,正在重新划定AI安全讨论的边界。

回溯到四月初的初次亮相,Anthropic明确表示,不会把Mythos级别的模型直接推向公众市场。Project Glasswing像是一个高压锅实验室,让模型在可控环境中暴露其“破坏性潜力”,同时收集防御策略。公司的原话是:“AI模型已经达到一种编码水准,能超越除顶尖人类之外的所有人,去发现并利用软件漏洞。”正因如此,开放预览就成了一个步步谨慎的试探。

五月份,Mythos的公布似乎触发了华盛顿的一次政策摇摆。当时,特朗普政府准备签署一项行政令,计划建立一套流程,让联邦政府能在AI系统发现软件漏洞后,先于模型公开发布前,与关键基础设施机构分享这些漏洞信息。但签字仪式据称在最后一刻被推迟,阻力来自特朗普本人以及科技行业。这一推迟,正好发生在Anthropic公开Mythos能力之后,让外界将两者联系在一起——一款前沿模型的内测消息,直接影响到了国家级监管节奏。

现在,随着150家新伙伴的加入,Project Glasswing的覆盖范围从科技圈扩展到了维持社会运转的命脉部门。Anthropic透露,正在“尽可能快地安全发布Mythos级别能力”,但在补上“高度稳健的防护措施”之前,不会取消访问限制。这意味着,即便模型已经展现出惊人的漏洞挖掘效率,其广泛可用依然取决于安全框架的成熟度,而不是单纯的技术就绪。

从最初的不到50家,到如今铺向全球十几个国家的公共事业和医疗机构,这场内测正在检验一个核心命题:当AI的攻击性足够强时,防御体系的建立能否跑在前面。Anthropic的选择是邀请那些一旦被攻破就会影响上亿人的单位,先让它们感受威胁,再共筑防线。这种“先暴露风险再谈开放”的路线,或许正是针对Mythos这类模型,一种不得已而为之的部署逻辑。

至于行政令的推迟会不会伴随新一轮监管讨论,目前尚无明确时间表。但Anthropic给出的信号很清晰:在网络安全这个领域,前沿模型已经不再是实验室里的论文指标,而是能够改写国家级攻防平衡的实际工具。Project Glasswing的扩容,正是把这个判断递到了更多关键决策者的面前。