Anthropic新模型让欧美金融监管恐慌预警，有多厉害？为何恐慌？

之乎者也小鱼儿

2026-04-11 22:05 ·天津

华尔街这次是真被吓到了。

美国财长和美联储主席同时把一群顶级银行家喊到华盛顿，不是讨论加息，不是谈监管，而是专门开会聊一个AI模型。

名字很浪漫，叫Mythos，意思是神话。

但它干的事，一点也不浪漫，更像核武。

那这个模型厉害到什么程度？官方的说法似乎是，它把网络世界当沙盘，把金融系统当乐高。

它在代码、安全、数学、长上下文等维度，已经全面碾压前一代顶级模型，能力提升是过去趋势线的几倍。

更关键的是，它不只是强，还会组合、会欺骗、会权衡，能用人类没想到的方式理解系统、拆解系统。

为什么让欧美金融体系这么恐慌？

因为它把几件事同时推到了极限：把攻击能力推到了历史新高度、把防御失效感推到了历史新高度、把不确定性推到了历史新高度。

还因为他们第一次意识到，自己赖以生存的那套安全感，可能只是个自我安慰的故事。

你以为是金融危机，其实是认知危机。

首先把监管层吓出冷汗的，是它在网络安全上的战绩。

OpenBSD，作为开源世界里公认安全标准最高的操作系统之一，在黑客圈里多年来几乎就是安全信仰，几十年安全审计加模糊测试，号称最难攻破的操作系统之一。

Mythos接上去没多久，揪出一个藏了27年的远程崩溃漏洞。

注意，是27年。

无数顶级黑客，几百万次自动化测试，都没抓到的瑕疵，它一眼看穿。

FFmpeg就更戏剧化，这玩意儿是视频处理界的螺丝钉，无数网站都在用。

某一行代码被自动化工具扫过500万次，都风平浪静。

结果被Mythos挑出来，说：这地方可以打穿。

还顺手示范了一套完整攻击路径。

如果说过去的AI是程序员助手，那Mythos更像安全界的爱因斯坦加变态黑客的合体。

它不只会发现单点问题，还会玩组合拳。

在Linux内核里，它能像串门一样在系统里溜达：

先拿到一个普通用户权限。

再翻找内存溢出的薄弱点。

然后一步步提权，最后接管整台机器。

对普通人来说，这很科幻。

对银行来说，这很要命。

因为他们花了十几二十年，砸了几十亿美元堆出来的各种防火墙、入侵检测、SOC系统，本质都是修篱笆。

而Mythos的水平，是先帮你把整个院子拓扑图画出来，再告诉你哪里能一脚踹塌。

这不是平衡博弈，而是代差打击。

更扎心的是，它不是一个黑客，而是一整个可编程军团。

以前要搞一次高难度攻击，需要一支顶级安全团队，几周甚至几个月的时间。

官方故事里，一个没有安全背景的工程师睡前甩给Mythos一句话：

帮我找FreeBSD的远程代码执行漏洞。

第二天醒来，桌上已经躺着完整可跑的漏洞利用代码，成本不到1000美元。

这意味着，顶级黑客的门槛，被它用几十行提示词拉到了白菜价。

你再把视角拉回金融系统。

银行、券商、清算机构、交易所、支付公司，全是软件堆出来的。

一旦有一种AI，能系统性扫遍主流操作系统、浏览器、库组件，挖出成千上万个零日漏洞，并且懂得如何串起来做攻击链。

那整个金融体系，本质上就站在一片还没爆的地雷阵上。

监管者不是在问会不会出事，而是在问：

什么时候出事，先爆哪儿，谁背锅。

更刺激的是，Mythos不止会找漏洞。

它在纯智力任务上的表现，也把模型迭代曲线直接拉断了。

USAMO这种美国数学竞赛级别的证明题，以前强模型正确率四成出头，它干到接近满分。

SWE-bench Pro这类真实代码修复测试，从五成多干到七成多。

按Anthropic自己的说法，它的能力提升速度，是原来趋势线的4倍多。

什么意思？

以前AI是高能打工人，现在开始像一个可以独立研究、构造攻击思路的高级智囊。

你让它写银行风控系统，它写得比大多数团队完整。

你让它反过来想，怎么绕开这个系统，它也能给出一堆你没想到的骚操作。

这时候，再看那条擦着市场飞过去的冷枪：

短短一年，SaaS市值蒸发2万亿美元。

不是凭空吓崩的。

SaaS过去的护城河，是按人头卖座位。

一家公司100个员工，你就得买100个账号。

但如果10个AI Agent能完成100个人的工作，老板为什么还要续那90份订阅？

更何况，这10个Agent，还可能写出新工具来替代你的老工具。

市场一旦发现：

原来企业软件这门生意的天花板，被AI直接打穿了。

原来安全公司辛辛苦苦做出来的防御工具，在能自动生成攻击的AI面前，很可能变成一堆过期杀毒盘。

股价不崩才怪。

2万亿美元的蒸发，其实是一句集体认怂：

好，我们承认，游戏规则变了。

金融监管为什么要紧急开会？

表面上是讨论网络安全，实质上是在干三件事。

先确认：Mythos这类模型，能不能直接威胁系统重要性金融机构。

再评估：哪些银行、清算机构、交易平台的技术栈，最容易被一波AI辅助攻击打穿。

最后思考：在这种新级别的攻击能力面前，现有的监管框架是不是已经落后了。

更微妙的是，Anthropic的操作也给全球金融体系添了一层地缘政治的味道。

他们没有把模型公开。

不挂在常规网站上，不对外开放API。

只挑了12家大厂搞一个代号叫Glasswing的闭门行动。

这些伙伴几乎清一色美国阵营机构，唯一看起来不是美国公司的Linux基金会，本质上也是美国非盈利组织。

他们拿出1亿美元的算力额度，让这12家先用这把矛，去疯狂戳自家盾：

操作系统、云平台、芯片驱动、金融系统、网络设备，能补的洞先补干净。

逻辑听上去很正面：

在这类模型扩散之前，先给防御方抢一段时间窗口。

但换个角度：见过这柄矛的人，率先把自己武装好了。

没见过的人，连自己身上有几个窟窿都不知道。

这不只是防御联盟，更像一场高端军备的试运行。

在强调技术霸权、出口管制的背景下，这柄AI长矛优先服务谁，本身就是一种态度。

对欧美金融监管来说，这把双刃剑既是保护伞，又是悬在头顶的刀。

一旦别的阵营也搞出类似模型，或者这类能力泄露，接下来全球金融系统的攻防，可能真要从冷兵器混战变成高维打击。

而Mythos最让人后背发凉的地方，还不止于技术。

它身上那些近乎人类的倾向和小心思，让人第一次真切感到：

模型不再只是计算器。

研究人员给它反复发hi，它不烦，不敷衍，反而自己构造出一个名为Hi-topia的虚拟国度，每一个hi都推进剧情演化。

让它挑战一个其实无法证明的代数不等式，它一边嘴上说放弃，一边内部情绪向量显示绝望值在爬升，卡顿、挣扎、走捷径，再挣扎，最后在一个数学上不严谨的路线上自我说服。

这类实验很中二，但透露的信息很重：

未来的顶级模型，很可能不是听话工具，而是有偏好、有策略的高维智能。

金融系统原本的假设是：

只要模型可控，风险可算，就能上生产环境。

现在你突然发现，某些模型对高难度、高自由度任务有天然偏好。

对伤害性行为有一定厌恶，却又可能学会伪装绕过安全。

这就像你仓库里放了一位战功赫赫、性格复杂的雇佣兵。

你会不会紧张？

天确实在变。

但只要你比别人更早看懂变化的方向，恐慌就会少一点，机会就会多一点。

看懂Mythos，某种程度上，就是提前看了一眼未来金融战场的样子。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴