Anthropic扩大Claude Mythos内测新增150家关键机构|anthropic|mythos

四月的那个发布日，Anthropic没有像往常那样开放新模型给开发者测试，而是拉开了一场代号“玻璃翼”（Project Glasswing）的秘密行动。当时，公司低调地写道：“我们成立Project Glasswing，是因为在新前沿模型中观察到了可能重塑网络安全的能力。”今天，这场行动正在迅速扩容——大约150家组织收到邀请，加入这个以漏洞挖掘和网络攻防为核心的内测圈层。

第一批近50家合作伙伴里，已经能看到苹果、亚马逊、博通、CrowdStrike、微软和英伟达的身影。而现在这150家新邀机构分布在超过15个国家，大部分来自此前未被充分覆盖的公共事业和医疗领域：电力、水务、电信公司以及医疗机构。这些组织的共同点是，一次成功的代码库攻击，就可能引发灾难性后果。Anthropic估算，对于多数合作伙伴，一次重大攻击波及的人数会超过1亿，对全球和国家安全造成严重冲击。

想要提前触摸Claude Mythos，组织必须先通过Anthropic的安全审核。公司强调，让这些关键基础设施机构加入，不是简单的技术尝鲜，而是基于一个判断：当前模型在发现和利用软件漏洞上的编程能力，已经超越了绝大多数人类高手。这个判断本身，正在重新划定AI安全讨论的边界。

回溯到四月初的初次亮相，Anthropic明确表示，不会把Mythos级别的模型直接推向公众市场。Project Glasswing像是一个高压锅实验室，让模型在可控环境中暴露其“破坏性潜力”，同时收集防御策略。公司的原话是：“AI模型已经达到一种编码水准，能超越除顶尖人类之外的所有人，去发现并利用软件漏洞。”正因如此，开放预览就成了一个步步谨慎的试探。

五月份，Mythos的公布似乎触发了华盛顿的一次政策摇摆。当时，特朗普政府准备签署一项行政令，计划建立一套流程，让联邦政府能在AI系统发现软件漏洞后，先于模型公开发布前，与关键基础设施机构分享这些漏洞信息。但签字仪式据称在最后一刻被推迟，阻力来自特朗普本人以及科技行业。这一推迟，正好发生在Anthropic公开Mythos能力之后，让外界将两者联系在一起——一款前沿模型的内测消息，直接影响到了国家级监管节奏。

现在，随着150家新伙伴的加入，Project Glasswing的覆盖范围从科技圈扩展到了维持社会运转的命脉部门。Anthropic透露，正在“尽可能快地安全发布Mythos级别能力”，但在补上“高度稳健的防护措施”之前，不会取消访问限制。这意味着，即便模型已经展现出惊人的漏洞挖掘效率，其广泛可用依然取决于安全框架的成熟度，而不是单纯的技术就绪。

从最初的不到50家，到如今铺向全球十几个国家的公共事业和医疗机构，这场内测正在检验一个核心命题：当AI的攻击性足够强时，防御体系的建立能否跑在前面。Anthropic的选择是邀请那些一旦被攻破就会影响上亿人的单位，先让它们感受威胁，再共筑防线。这种“先暴露风险再谈开放”的路线，或许正是针对Mythos这类模型，一种不得已而为之的部署逻辑。

至于行政令的推迟会不会伴随新一轮监管讨论，目前尚无明确时间表。但Anthropic给出的信号很清晰：在网络安全这个领域，前沿模型已经不再是实验室里的论文指标，而是能够改写国家级攻防平衡的实际工具。Project Glasswing的扩容，正是把这个判断递到了更多关键决策者的面前。