我觉得,人类或许正在以一种超出常规认知的速度在被 AI 追赶。

不知道你们的现状是怎样的,至少我现在已经完全离不开 AI 了,我每天的工作中至少有 50% 是 AI 辅助完成的。

而且,这个比例还在持续提升。

与此同时,随着一代又一代新模型的推出,不管是我的工作效率和质量,还是我在 Token 上的每月消费,都在快速增长。

昨晚我看了个消息,Anthropic 发布了一个连他们自己都不敢公开给所有人使用的模型,因为真的太强了。

这个新模型的名字叫「Mythos」,翻译成中文就是「神话」的意思。

目前是预览版,所以官方叫它「Mythos Preview」。不过,这次是以一个叫「Project Glasswing」的项目形式推出的。

关于这个项目,我后面会讲。

打开网易新闻 查看精彩图片

上个月,Anthropic 一份内部文档意外泄露,里面提到有一个比 Opus 更大、更强的模型正在开发,代号就是 Mythos。

随后,Anthropic 把这次泄露归因于「人为错误」,也没有进一步说明理由。

现在,这个代号是 Mythos 的模型算是正式官宣了。

官宣归官宣,但它并没有公开发布上线。也就是说,普通用户还不能使用。

原因很直接,Anthropic 觉得这个模型太强了,在安全机制到位之前不适合向所有人开放。

我觉得,这句话值得停下来想一秒。

通常,一家 AI 公司发布新模型巴不得第一时间上线抢占市场,但这次 Anthropic 的做法明显有点反常。

在我看来,不是他们不想发,而是不敢发。

因为,这个叫 Mythos 的模型的确很强大。

先看几个官方公布的测试数据。

在编码能力上,Mythos 和目前公开最强的 Claude Opus 4.6 之间的差距不小,在各项基准测试中,Mythos 基本是完胜 Opus 4.6。

打开网易新闻 查看精彩图片

推理能力上,在 GPQA Diamond(研究生水平科学问答)测试中,结果是 94.6% vs 91.3%,Mythos 胜。

在 Humanity's Last Exam 有工具和无工具测试中,也都是 Mythos 完胜。

打开网易新闻 查看精彩图片

跟 Agent 有关的计算机操作能力上,OSWorld-Verified(自主完成电脑任务),Mythos 以 79.6% 超过 Oputs 4.6 的 72.7%。

每一个维度上,Mythos 都强于 Opus 4.6,有些甚至是碾压式超过。

打开网易新闻 查看精彩图片

在一些任务表现上,差距已经不是小步迭代,而是大幅跃升。比如 SWE-bench Multimodal 从 27.1% 跳到 59%,几乎翻了一倍。

让他们不敢上线 Mythos 的一个最核心原因,就是它突破软件世界的安全防线能力太强了。

说白了,全世界所有的系统和软件都有漏洞,而 Mythos 可以用超过人类的水平发现并攻击这些漏洞。

假设,这种能力被黑客掌握,那全世界的操作系统和软件都会遭殃,尤其是一些公共基础设施和国家安全。

Anthropic 在公告里有这么一句话,看完后我觉得细思极恐。

打开网易新闻 查看精彩图片

翻译过来就是:「 AI 模型的编码能力已经达到了极高水平,在发现和利用软件漏洞方面,它们几乎可以超越除最熟练的人类之外的所有人」。

关于这句话,我想多展开一下。

我是程序员出身,所以我知道软件的构建方式是怎样的,以及不同人写出来的代码差异有多大。

还有,没有哪个软件敢说自己没有漏斗,即便这个漏洞从来没被发现过。

以前的漏洞之所以能几十年安静地躺在系统里,并不是因为系统足够安全。

而是因为找漏洞这件事,需要极高的专业能力,极大的耐心和精力,以及大量的时间。

会的人太少,敢投入的人就更少了。

这种「能力稀缺」,构成了整个软件安全世界的隐性前提。AI 介入之后,这个前提就开始松动了。

AI 能以超过大多数非顶尖人类能力的方式开展工作,我们可以用它来攻击漏洞,当然也可以用它来堵住漏洞。

为了解决这个问题,接下来我说下 Anthropic 搞的这个 Project Glasswing 是什么。

简单说,这是一个利用 Mythos 的能力帮全世界基础设施系统找 bug 的项目。

参与方包括 AWS、苹果、微软、谷歌、英伟达、思科、Linux 基金会等共计 12 家机构。

打开网易新闻 查看精彩图片

这个阵容覆盖了云计算、操作系统、芯片、浏览器、金融基础设施、网络安全和开源生态。

换句话说,全球数字基础设施的核心参与者几乎都在这个项目里了。

这个项目的核心逻辑只有一条,让防守方先用上这个顶级 AI 模型的能力。

因为如果攻击方先拿到同等级的工具,窗口一旦打开就很难关上。Anthropic 承诺提供 1 亿美元的模型使用额度,覆盖研究预览期。

除了 12 家核心机构,还有超过 40 个维护关键软件基础设施的组织获得了访问权限,可以用 Mythos 扫描自家系统和开源项目。

同时,Anthropic 向 Linux 基金会捐了 250 万美元,向 Apache 软件基金会捐了 150 万美元,这二者都是软件世界的基础设施。

这么说吧,我们现在使用的各种 App、网站、系统,基本上都是以他们为底层架构的。

在我看来,Anthropic 这次算是干了件好事,不仅推出了更强的模型,还花钱给全球信息基础设施让他们来完善自己。

毕竟,如果裸上的话,对谁都没有好处。

可能说到这你还是感觉不到 Mythos 到底有多强,我从官方原文里看到了三个具体案例,我觉得比数字更能说明问题。

打开网易新闻 查看精彩图片

第一个,OpenBSD。

这是公认安全性极高的操作系统,很多关键基础设施会跑在上面,包括我们用的苹果手机 iOS 系统、Android 系统、甚至一些企业和机构内部系统。

Mythos 在里面发现了一个存在了 27 年的漏洞,攻击者只要连上目标机器,就能让它远程崩溃。

27 年!不是没人在意,是压根没人找到。

第二个,FFmpeg。

几乎所有需要处理视频的软件都依赖它,你们用的各种视频播放软件基本上都有它的身影。

有个漏洞躲在一行写于 16 年前的代码里,自动化测试工具反复攻击了整整 500 万次,每次都没找到。

但是,Mythos 找到了。

第三个,Linux 内核。

这个就不用多说了,基本上可以说是整个互联网的基础设施,也最值得警惕。

Mythos 不只是发现了几个独立漏洞,而是把多个漏洞串联成一条攻击链。

从普通用户权限开始,一路提权,最终实现对整台机器的完全控制。

关于 Linux 这个,和前两个案例的性质完全不一样。

找漏洞,是分析能力。

但串漏洞,就是策略能力了。

就像很多产品经理,会画原型图会写文档会做数据分析,这些是单点能力。但把业务、产品、商业串起来,就是策略能力了。

一个能规划攻击路径的模型,已经不只是审计工具了,它更接近于一个可以在数字环境里主动行动的智能体。

以上三个案例,Anthropic 采取的都是先发现、先报告、先修复、再披露的方式,目前均已修复。

看到这,你就知道 Mythos 有多强了,就像一头暂时不敢被放出笼的猛兽,现实世界需要先做好适应它的准备。

我想在这里说几个观察,或许也是接下来真正变化的开始。

第一,软件世界的安全假设正在失效。

今天我们习以为常的软件稳定性,并不完全来自系统设计足够好。很大程度上,它依赖的是攻击能力的稀缺。

说得直白点,不是软件足够强,而是人不够强。

找漏洞需要成本,构造利用链需要时间,大规模扫描需要资源。所以很多技术债、陈年 bug、老旧系统就那样活着,从没被认真清理过。

就像我们做产品一样,我们觉得逻辑闭环了,没问题了,并不代表真的万事无忧了,很可能是我们的能力上限到了。

Mythos 展现的能力,是漏洞从被发现到被利用的时间窗口从过去的几个月被压缩到了几分钟。

几分钟意味着什么?

意味着补丁的节奏,修复的流程,已经开始跟不上攻击的速度了。

第二,开源世界会最先感受到压力。

今天大多数现代软件,底下都压着大量开源依赖。平时看不见,一旦被打穿,就是全行业同时受影响。

可能有读者不是很了解这个逻辑,用大白话说,就是我们现在使用的所有软件都有开源项目作为底层,而这些项目的源代码是对所有人可见的。

以后当模型能持续地、大规模地扫描开源项目,开源社区维护者们面对的压力级别会完全不一样。

这也是为什么 Anthropic 要给 Linux 基金会和 Apache 基金会捐钱的原因。

不是做公益,而是承认开源基础设施是 AI 时代整个数字世界最脆弱、也最不能倒的那层地基,他们不想被当做坏人和恶人而已。

第三,人会被弱化,AI 开始和 AI 博弈。

以前互联网产品安全团队的价值,在于人的判断力、经验积累和对系统的深度理解。

未来,这件事会换个逻辑。

比的是谁的模型更强,谁的工具接得更快,谁能把 AI 审计嵌进开发流程的最前端。

这不是程序员被替代的问题,而是安全行业本身的生产方式会重组。

好的那面,是数千个高危漏洞可以在几周内被找出来。麻烦的是,攻击方迟早也会有同等级的工具。

到那个时候,软件产品的安全不再是人和人的对抗,而是模型和模型之间的攻防博弈。

这次,Anthropic 不只发布了能力,还发布了风险。可能是目前这个阶段,整个行业最需要看到的那种诚实。

所有人都在谈 AI 如何改变工作效率,这没毛病。

但 Mythos 也在提醒我们,AI 能力的跃最终会从内容世界传导到软件世界,再传导到整个数字世界的基础设施。

内容世界被改写,影响的是流量逻辑。

软件世界被改写,动的是地基。

此时,我想起了电影《2012》里的一句台词,也作为这篇文章的结尾吧。

「无论你是谁,不分种族,不分国家,明天我们都没有区别!」

PS:我很少写这种长文,看到这你至少已经花了10分钟,说明你是拥抱变化喜欢思考的人。那么,就来个点赞、在看、转发,让更多人加入对明天的期待中。

················· 唐韧出品 ·················

安可时刻

昨天看完 Mythos 的官方介绍后,我起身走到窗边发了一会儿呆。

没想什么,只是有点恍惚,而我的几个 AI 员工还在电脑上帮我干活,有的在分析数据、有的在搭建文章框架、有的在写项目文档。

昨天我还新招了个 AI 员工,取名唐小艺,以后我所有的封面图、海报、甚至我的日常摄影需求都交给他了。

打开网易新闻 查看精彩图片

以下,就是他给我「拍」的一张照片,还原了上面我描述的场景。

打开网易新闻 查看精彩图片