四月初,Anthropic发布新一代前沿模型Claude Mythos时,没有选择直接面向公众开放,而是启动了一个名为“Project Glasswing”的有限预览计划。当时这家公司表示,他们在新模型的训练过程中观察到了一些能力,足以重塑网络安全格局。“我们建立玻璃翼计划,是因为在一个新前沿模型中看到了我们认为可以重新定义网络安全的潜力。”Anthropic在公开声明中写道,“AI模型的编程能力已经达到了除了最顶尖的人类专家之外,无人能及的水平,能够发现并利用软件漏洞。”这番表态,与其说是在介绍产品,不如说是在向行业发出预警:模型的安全潜力与破坏潜力同步增长。
与声明同时公布的,是近50家首批受邀的合作伙伴——苹果、亚马逊、博通、CrowdStrike、微软和英伟达等科技巨头均在列。这些企业共同的特点,一是自身拥有庞大的代码基,二是切身体会过网络攻击的灾难性后果。Anthropic在当时留下了明确的信号:他们希望先在可控环境中,与那些最能感受到风险、也最能提供安全反馈的组织一起,测试并驯化模型的能力。而今天,这份名单被大幅拉长。Anthropic宣布向约150家新组织发出邀请,这些机构分布在15个以上的国家,所在的行业在第一轮中并未充分覆盖。
新一批加入者的身份很有意思。不再是硅谷的明星公司,而是那些平日里离网络安全新闻稍远,但一旦出事就影响巨大的基础设施部门——电力、水务、电信等公用事业,以及医疗机构。Anthropic对此给出的解释直白且沉重:“这些伙伴的共同点在于,一旦他们的代码基遭受成功攻击,后果将是灾难性的。”对于其中大多数组织,公司估算一次重大攻击可能影响超过1亿人,并牵连全球安全和国家安全。这个数字并非凭空而来,而是直接对应着这些行业服务的城市体量和人口密度。一家大型电力公司或水务系统的代码被攻破,可能意味着一整片区域的瘫痪,这正是Anthropic选择定向开放预览的紧迫感所在。
想获得Claude Mythos的访问权,新受邀机构需要先通过Anthropic设定的安全审核门槛。至于具体的要求是什么,公司没有展开,但可以想见的是,这些在基础民生领域运营的组织,其网络安全成熟度、应急响应流程和对漏洞披露的参与意愿,都会成为评判尺度。Anthropic意图不是单纯扩大测试规模,而是试图在“高能力模型”与“高风险场景”之间建立一道有筛选的缓冲。这也呼应了它强调的原则:在完善的防御措施到位之前,不会将秘思级别能力广泛推向大众。
时间往前拨一点,今年五月,Claude Mythos的公布似乎意外搅动了美国科技政策的进程。原本白宫传出的消息是,总统将签署一份行政令,确立一套流程,让联邦政府能在AI模型公开之前,就已发现的软件漏洞信息与关键机构共享。这套流程的核心正是由AI系统识别出的漏洞,其背后指向的正是类似于秘思这样的模型。然而,据多家媒体报道,由于特朗普本人的反对以及科技行业的游说,签字仪式在最后一刻被推迟。Anthropic当时并未就此事直接发声,但其“先管控后开放”的主张,已经在这场政策博弈中形成了一股别样声量——它用实际的限制动作表明,有些能力,宁可晚一点释放,也不能在缺防护的姿态下冒险。
眼下,玻璃翼计划迈入第二阶段,这算不上一个常规的产品推广。从初期50家到如今超过200家的规模,Anthropic仍然把入口收得很紧,并自始至终在强调一个逻辑:模型的能力越强,越需要被置于可信任的链条中。新加入的公用事业和医疗行业的伙伴,将有机会直接观察到一个顶尖AI如何扫描、定位甚至利用代码漏洞——目的不在于展示威胁,而在于帮助防守方提前看清自己系统的薄弱处。正如Anthropic在公告中所言,他们正在“以最快的速度安全地释放秘思级别能力”,但这扇门打开的速度,永远以坚固的防护为上限。
热门跟贴