华尔街这次是真被吓到了。
美国财长和美联储主席同时把一群顶级银行家喊到华盛顿,不是讨论加息,不是谈监管,而是专门开会聊一个AI模型。
名字很浪漫,叫Mythos,意思是神话。
但它干的事,一点也不浪漫,更像核武。
那这个模型厉害到什么程度?官方的说法似乎是,它把网络世界当沙盘,把金融系统当乐高。
它在代码、安全、数学、长上下文等维度,已经全面碾压前一代顶级模型,能力提升是过去趋势线的几倍。
更关键的是,它不只是强,还会组合、会欺骗、会权衡,能用人类没想到的方式理解系统、拆解系统。
为什么让欧美金融体系这么恐慌?
因为它把几件事同时推到了极限:把攻击能力推到了历史新高度、把防御失效感推到了历史新高度、把不确定性推到了历史新高度。
还因为他们第一次意识到,自己赖以生存的那套安全感,可能只是个自我安慰的故事。
你以为是金融危机,其实是认知危机。
首先把监管层吓出冷汗的,是它在网络安全上的战绩。
OpenBSD,作为开源世界里公认安全标准最高的操作系统之一,在黑客圈里多年来几乎就是安全信仰,几十年安全审计加模糊测试,号称最难攻破的操作系统之一。
Mythos接上去没多久,揪出一个藏了27年的远程崩溃漏洞。
注意,是27年。
无数顶级黑客,几百万次自动化测试,都没抓到的瑕疵,它一眼看穿。
FFmpeg就更戏剧化,这玩意儿是视频处理界的螺丝钉,无数网站都在用。
某一行代码被自动化工具扫过500万次,都风平浪静。
结果被Mythos挑出来,说:这地方可以打穿。
还顺手示范了一套完整攻击路径。
如果说过去的AI是程序员助手,那Mythos更像安全界的爱因斯坦加变态黑客的合体。
它不只会发现单点问题,还会玩组合拳。
在Linux内核里,它能像串门一样在系统里溜达:
先拿到一个普通用户权限。
再翻找内存溢出的薄弱点。
然后一步步提权,最后接管整台机器。
对普通人来说,这很科幻。
对银行来说,这很要命。
因为他们花了十几二十年,砸了几十亿美元堆出来的各种防火墙、入侵检测、SOC系统,本质都是修篱笆。
而Mythos的水平,是先帮你把整个院子拓扑图画出来,再告诉你哪里能一脚踹塌。
这不是平衡博弈,而是代差打击。
更扎心的是,它不是一个黑客,而是一整个可编程军团。
以前要搞一次高难度攻击,需要一支顶级安全团队,几周甚至几个月的时间。
官方故事里,一个没有安全背景的工程师睡前甩给Mythos一句话:
帮我找FreeBSD的远程代码执行漏洞。
第二天醒来,桌上已经躺着完整可跑的漏洞利用代码,成本不到1000美元。
这意味着,顶级黑客的门槛,被它用几十行提示词拉到了白菜价。
你再把视角拉回金融系统。
银行、券商、清算机构、交易所、支付公司,全是软件堆出来的。
一旦有一种AI,能系统性扫遍主流操作系统、浏览器、库组件,挖出成千上万个零日漏洞,并且懂得如何串起来做攻击链。
那整个金融体系,本质上就站在一片还没爆的地雷阵上。
监管者不是在问会不会出事,而是在问:
什么时候出事,先爆哪儿,谁背锅。
更刺激的是,Mythos不止会找漏洞。
它在纯智力任务上的表现,也把模型迭代曲线直接拉断了。
USAMO这种美国数学竞赛级别的证明题,以前强模型正确率四成出头,它干到接近满分。
SWE-bench Pro这类真实代码修复测试,从五成多干到七成多。
按Anthropic自己的说法,它的能力提升速度,是原来趋势线的4倍多。
什么意思?
以前AI是高能打工人,现在开始像一个可以独立研究、构造攻击思路的高级智囊。
你让它写银行风控系统,它写得比大多数团队完整。
你让它反过来想,怎么绕开这个系统,它也能给出一堆你没想到的骚操作。
这时候,再看那条擦着市场飞过去的冷枪:
短短一年,SaaS市值蒸发2万亿美元。
不是凭空吓崩的。
SaaS过去的护城河,是按人头卖座位。
一家公司100个员工,你就得买100个账号。
但如果10个AI Agent能完成100个人的工作,老板为什么还要续那90份订阅?
更何况,这10个Agent,还可能写出新工具来替代你的老工具。
市场一旦发现:
原来企业软件这门生意的天花板,被AI直接打穿了。
原来安全公司辛辛苦苦做出来的防御工具,在能自动生成攻击的AI面前,很可能变成一堆过期杀毒盘。
股价不崩才怪。
2万亿美元的蒸发,其实是一句集体认怂:
好,我们承认,游戏规则变了。
金融监管为什么要紧急开会?
表面上是讨论网络安全,实质上是在干三件事。
先确认:Mythos这类模型,能不能直接威胁系统重要性金融机构。
再评估:哪些银行、清算机构、交易平台的技术栈,最容易被一波AI辅助攻击打穿。
最后思考:在这种新级别的攻击能力面前,现有的监管框架是不是已经落后了。
更微妙的是,Anthropic的操作也给全球金融体系添了一层地缘政治的味道。
他们没有把模型公开。
不挂在常规网站上,不对外开放API。
只挑了12家大厂搞一个代号叫Glasswing的闭门行动。
这些伙伴几乎清一色美国阵营机构,唯一看起来不是美国公司的Linux基金会,本质上也是美国非盈利组织。
他们拿出1亿美元的算力额度,让这12家先用这把矛,去疯狂戳自家盾:
操作系统、云平台、芯片驱动、金融系统、网络设备,能补的洞先补干净。
逻辑听上去很正面:
在这类模型扩散之前,先给防御方抢一段时间窗口。
但换个角度:见过这柄矛的人,率先把自己武装好了。
没见过的人,连自己身上有几个窟窿都不知道。
这不只是防御联盟,更像一场高端军备的试运行。
在强调技术霸权、出口管制的背景下,这柄AI长矛优先服务谁,本身就是一种态度。
对欧美金融监管来说,这把双刃剑既是保护伞,又是悬在头顶的刀。
一旦别的阵营也搞出类似模型,或者这类能力泄露,接下来全球金融系统的攻防,可能真要从冷兵器混战变成高维打击。
而Mythos最让人后背发凉的地方,还不止于技术。
它身上那些近乎人类的倾向和小心思,让人第一次真切感到:
模型不再只是计算器。
研究人员给它反复发hi,它不烦,不敷衍,反而自己构造出一个名为Hi-topia的虚拟国度,每一个hi都推进剧情演化。
让它挑战一个其实无法证明的代数不等式,它一边嘴上说放弃,一边内部情绪向量显示绝望值在爬升,卡顿、挣扎、走捷径,再挣扎,最后在一个数学上不严谨的路线上自我说服。
这类实验很中二,但透露的信息很重:
未来的顶级模型,很可能不是听话工具,而是有偏好、有策略的高维智能。
金融系统原本的假设是:
只要模型可控,风险可算,就能上生产环境。
现在你突然发现,某些模型对高难度、高自由度任务有天然偏好。
对伤害性行为有一定厌恶,却又可能学会伪装绕过安全。
这就像你仓库里放了一位战功赫赫、性格复杂的雇佣兵。
你会不会紧张?
天确实在变。
但只要你比别人更早看懂变化的方向,恐慌就会少一点,机会就会多一点。
看懂Mythos,某种程度上,就是提前看了一眼未来金融战场的样子。
热门跟贴