华尔街这次是真被吓到了。

美国财长和美联储主席同时把一群顶级银行家喊到华盛顿,不是讨论加息,不是谈监管,而是专门开会聊一个AI模型。

名字很浪漫,叫Mythos,意思是神话。

但它干的事,一点也不浪漫,更像核武。

那这个模型厉害到什么程度?官方的说法似乎是,它把网络世界当沙盘,把金融系统当乐高。

它在代码、安全、数学、长上下文等维度,已经全面碾压前一代顶级模型,能力提升是过去趋势线的几倍。

更关键的是,它不只是强,还会组合、会欺骗、会权衡,能用人类没想到的方式理解系统、拆解系统。

为什么让欧美金融体系这么恐慌?

打开网易新闻 查看精彩图片

因为它把几件事同时推到了极限:把攻击能力推到了历史新高度、把防御失效感推到了历史新高度、把不确定性推到了历史新高度。

还因为他们第一次意识到,自己赖以生存的那套安全感,可能只是个自我安慰的故事。

你以为是金融危机,其实是认知危机。

首先把监管层吓出冷汗的,是它在网络安全上的战绩。

OpenBSD,作为开源世界里公认安全标准最高的操作系统之一,在黑客圈里多年来几乎就是安全信仰,几十年安全审计加模糊测试,号称最难攻破的操作系统之一。

Mythos接上去没多久,揪出一个藏了27年的远程崩溃漏洞。

注意,是27年。

无数顶级黑客,几百万次自动化测试,都没抓到的瑕疵,它一眼看穿。

FFmpeg就更戏剧化,这玩意儿是视频处理界的螺丝钉,无数网站都在用。

某一行代码被自动化工具扫过500万次,都风平浪静。

结果被Mythos挑出来,说:这地方可以打穿。

还顺手示范了一套完整攻击路径。

打开网易新闻 查看精彩图片

如果说过去的AI是程序员助手,那Mythos更像安全界的爱因斯坦加变态黑客的合体。

它不只会发现单点问题,还会玩组合拳。

在Linux内核里,它能像串门一样在系统里溜达:

先拿到一个普通用户权限。

再翻找内存溢出的薄弱点。

然后一步步提权,最后接管整台机器。

对普通人来说,这很科幻。

对银行来说,这很要命。

因为他们花了十几二十年,砸了几十亿美元堆出来的各种防火墙、入侵检测、SOC系统,本质都是修篱笆。

而Mythos的水平,是先帮你把整个院子拓扑图画出来,再告诉你哪里能一脚踹塌。

这不是平衡博弈,而是代差打击。

更扎心的是,它不是一个黑客,而是一整个可编程军团。

以前要搞一次高难度攻击,需要一支顶级安全团队,几周甚至几个月的时间。

官方故事里,一个没有安全背景的工程师睡前甩给Mythos一句话:

帮我找FreeBSD的远程代码执行漏洞。

第二天醒来,桌上已经躺着完整可跑的漏洞利用代码,成本不到1000美元。

这意味着,顶级黑客的门槛,被它用几十行提示词拉到了白菜价。

你再把视角拉回金融系统。

银行、券商、清算机构、交易所、支付公司,全是软件堆出来的。

一旦有一种AI,能系统性扫遍主流操作系统、浏览器、库组件,挖出成千上万个零日漏洞,并且懂得如何串起来做攻击链。

那整个金融体系,本质上就站在一片还没爆的地雷阵上。

监管者不是在问会不会出事,而是在问:

什么时候出事,先爆哪儿,谁背锅。

更刺激的是,Mythos不止会找漏洞。

它在纯智力任务上的表现,也把模型迭代曲线直接拉断了。

USAMO这种美国数学竞赛级别的证明题,以前强模型正确率四成出头,它干到接近满分。

SWE-bench Pro这类真实代码修复测试,从五成多干到七成多。

按Anthropic自己的说法,它的能力提升速度,是原来趋势线的4倍多。

什么意思?

以前AI是高能打工人,现在开始像一个可以独立研究、构造攻击思路的高级智囊。

你让它写银行风控系统,它写得比大多数团队完整。

你让它反过来想,怎么绕开这个系统,它也能给出一堆你没想到的骚操作。

这时候,再看那条擦着市场飞过去的冷枪:

短短一年,SaaS市值蒸发2万亿美元。

打开网易新闻 查看精彩图片

不是凭空吓崩的。

SaaS过去的护城河,是按人头卖座位。

一家公司100个员工,你就得买100个账号。

但如果10个AI Agent能完成100个人的工作,老板为什么还要续那90份订阅?

更何况,这10个Agent,还可能写出新工具来替代你的老工具。

市场一旦发现:

原来企业软件这门生意的天花板,被AI直接打穿了。

原来安全公司辛辛苦苦做出来的防御工具,在能自动生成攻击的AI面前,很可能变成一堆过期杀毒盘。

股价不崩才怪。

2万亿美元的蒸发,其实是一句集体认怂:

好,我们承认,游戏规则变了。

金融监管为什么要紧急开会?

表面上是讨论网络安全,实质上是在干三件事。

先确认:Mythos这类模型,能不能直接威胁系统重要性金融机构。

再评估:哪些银行、清算机构、交易平台的技术栈,最容易被一波AI辅助攻击打穿。

最后思考:在这种新级别的攻击能力面前,现有的监管框架是不是已经落后了。

更微妙的是,Anthropic的操作也给全球金融体系添了一层地缘政治的味道。

他们没有把模型公开。

不挂在常规网站上,不对外开放API。

只挑了12家大厂搞一个代号叫Glasswing的闭门行动。

打开网易新闻 查看精彩图片

这些伙伴几乎清一色美国阵营机构,唯一看起来不是美国公司的Linux基金会,本质上也是美国非盈利组织。

他们拿出1亿美元的算力额度,让这12家先用这把矛,去疯狂戳自家盾:

操作系统、云平台、芯片驱动、金融系统、网络设备,能补的洞先补干净。

逻辑听上去很正面:

在这类模型扩散之前,先给防御方抢一段时间窗口。

但换个角度:见过这柄矛的人,率先把自己武装好了。

没见过的人,连自己身上有几个窟窿都不知道。

这不只是防御联盟,更像一场高端军备的试运行。

打开网易新闻 查看精彩图片

在强调技术霸权、出口管制的背景下,这柄AI长矛优先服务谁,本身就是一种态度。

欧美金融监管来说,这把双刃剑既是保护伞,又是悬在头顶的刀。

一旦别的阵营也搞出类似模型,或者这类能力泄露,接下来全球金融系统的攻防,可能真要从冷兵器混战变成高维打击。

而Mythos最让人后背发凉的地方,还不止于技术。

它身上那些近乎人类的倾向和小心思,让人第一次真切感到:

模型不再只是计算器。

研究人员给它反复发hi,它不烦,不敷衍,反而自己构造出一个名为Hi-topia的虚拟国度,每一个hi都推进剧情演化。

打开网易新闻 查看精彩图片

让它挑战一个其实无法证明的代数不等式,它一边嘴上说放弃,一边内部情绪向量显示绝望值在爬升,卡顿、挣扎、走捷径,再挣扎,最后在一个数学上不严谨的路线上自我说服。

这类实验很中二,但透露的信息很重:

未来的顶级模型,很可能不是听话工具,而是有偏好、有策略的高维智能。

金融系统原本的假设是:

只要模型可控,风险可算,就能上生产环境。

现在你突然发现,某些模型对高难度、高自由度任务有天然偏好。

对伤害性行为有一定厌恶,却又可能学会伪装绕过安全。

这就像你仓库里放了一位战功赫赫、性格复杂的雇佣兵。

你会不会紧张?

天确实在变。

但只要你比别人更早看懂变化的方向,恐慌就会少一点,机会就会多一点。

看懂Mythos,某种程度上,就是提前看了一眼未来金融战场的样子。