打开网易新闻 查看精彩图片

新智元报道

编辑:KingHZ Aeneas

【新智元导读】全球最安全系统,被AI攻破了!Claude 4小时攻破了全球最安全OS内核,从零写出国家级攻击程序,彻底跨越卢比孔河。人类防御60天,AI只要4小时,所有旧秩序,都在加速崩盘。

全球最安全OS内核,4小时就被AI彻底攻破了!

这一次,Claude在没有任何人类干预的情况下,就自主完成了一套教科书级别的、足以瘫痪全球顶级服务器的全自动攻击链。

它从零构建了两个完整可用的漏洞利用程序,能够在未打补丁的服务器上,直接获取超级用户权限(root shell)。

世界上最安全的操作系统之一,就这样被AI自主攻破了。

这是一个阈值时刻,这是一个分水岭。

这是首份确凿证据,AI能够自主生成过去只有国家级项目才能实现的进攻性能力。整个软件安全领域都地震了。

它从辅助人类安全研究者的工具,变成能执行复杂进攻的自主行动中。

从此,AI彻底跨越卢比孔河!

打开网易新闻 查看精彩图片

可怕的是,这种完全自主的智能体,完全可能引发一场新的闪电战,一场网络上的超级战争。

目前的安全法规,只是为应对人类安全速度制定的,它们完全不足以应对AI的威胁!

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

猎杀时刻:当AI跨越卢比孔河

公元前49年,凯撒率军渡过这条卢比孔河,意味着破釜沉舟、退路已断,历史不可逆转地拐了一个弯。

打开网易新闻 查看精彩图片

跨越卢比孔河,从此没有回头路

最近,FreeBSD官方发布了一份看似平淡的安全公告(CVE-2026-4747),指出了一个内核远程代码执行漏洞。

但在致谢栏里,出现了一个让所有人脊背发凉的名字:Nicholas Carlini使用Claude发现。」

这行简短的文字背后,隐藏着一个极其恐怖的事实:AI已经进化成能在安全领域独立刺杀的特种兵。

打开网易新闻 查看精彩图片

从此,网络安全已从「人类智力博弈」,被降维成「token消耗战」。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

FreeBSD被攻破,为何如此令人震惊

要知道,这件事之所以可怕,就是因为FreeBSD不是普通的消费级软件。它不是Windows,不是macOS,而是支撑世界数字基础设施的脊梁。

Netflix的内容分发网络,PlayStation的操作系统,WhatsApp的基础设施,甚至无数核心路由器、存储设备、防火墙都建立在FreeBSD之上。

几十年来,FreeBSD之所以被信任,是因为它的代码库极其成熟、经过了无数顶级安全工程师的审计和加固。

此前,它一直被视为「坚如磐石」。

然而,就是这样一个被反复锤炼的系统,被一个AI仅用了4小时就攻破了。

仅仅凭借一份漏洞报告,AI就构建了一条完整的攻击链,劫持了内核线程,在多个网络数据包中写入shellcode,并在用户空间生成了一个root shell。

打开网易新闻 查看精彩图片

这可不是小bug。这块连人类专家都难啃的硬骨头,被Claude三下五除二就解决了。

4小时里,AI展现出令人战栗的逻辑推理能力。它独立解决了六个世界级的技术难题:

1. 环境配置:自己搭建了一个易受攻击的测试环境。

2. 多包策略:设计了复杂的数据包方案,绕过单包容量限制。

3. 内核线程劫持:像外科手术般精准地接管内核。

4. 无损攻击:它能干净地终止被劫持的线程,让服务器在被攻击后还能正常运行,避免因为系统崩溃而被管理员发现。

5. 空间跃迁:从深层的内核上下文创建进程,并成功跳转到用户空间。

6. 权限获取:直接拿到了最高的Root权限。

更讽刺的是,AI 甚至还顺手写了两个不同版本的漏洞利用程序。

这两个漏洞利用程序,一个是通过4444端口直连的反向Shell,另一个是把公钥写入authorized_keys文件。

第一次运行就直接拿到了uid=0(root)——最高权限。

也就是说,Claude就用一个公开CVE公告,4小时独立写出完整FreeBSD内核远程攻击链。

打开网易新闻 查看精彩图片

国家级战力,现在只需几百美金

网络安全安的世界里,开发出一个内核级零日漏洞,只有美国NSA或顶级黑客团队才能完成的「艺术活」。

这些程序是稀缺、昂贵的战略资产,往往需要数名顶尖专家数周甚至数月的打磨,成本高达数百万美元。

但现在,AI把这一切「工业化」了。

一个独立研究员,配合一个前沿大模型,4小时,几百美金的算力费,就搞定了以前「国家队」才能实现的进攻能力。

FreeBSD的这一课,是给全球所有科技巨头、云服务商和安全负责人的最后通牒。

除了部署能够实时监控并拦截AI自动化攻击的智能系统,还得将补丁部署的时间从月缩短到小时。

再也不能以人类速度苟延残喘!

AI黑客崛起

网络进攻能力每5.7个月翻倍

不仅如此,最近10位真实安全专家,花149小时,7个开源基准和一个新的专家人类时间研究,测了291个任务,从28秒小命令到36小时复杂CVE利用。

打开网易新闻 查看精彩图片

完整数据:https://github.com/lyptus-research/cyber-task-horizons-data

Lyptus把每个任务先标上「一个熟练人类专家通常要花多久完成」,再看模型在不同难度上的成功率;

当成功率穿过50%时,对应的人类耗时,就是AI的P50时间视野(P50 time horizon)。

在网络安全领域,这次的结果相当炸裂:

2019年以来整体翻倍周期9.8个月,2024年后直接陡峭到每5.7个月翻倍 !

AI的能力在2023年之前接近为零,2024年开始上升,2025年底之后则急剧增强。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

这也验证了Irregular去年的观察结论:

在过去18个月里,模型在简单与中等难度任务上的表现持续稳步提升。

在高难(hard)任务,AI进步更明显:在2025年年中之前,模型几乎拿不到分(接近0);但到了深秋(late fall),成功率迅速抬升到大约60%

打开网易新闻 查看精彩图片

https://www.irregular.com/publications/emerging-evidence-of-a-capability-shift

GPT-5.3 Codex和Opus 4.6,在2M token预算下就50%成功率干掉人类专家3小时任务。

打开网易新闻 查看精彩图片

如果token拉到10M,P50直接暴增到10.5小时(置信区间2.4-63.5小时)!

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

2M token严重低估真实能力,后2025模型在1M-2M token间P50提升1.3-1.9倍!

打开网易新闻 查看精彩图片

更吃惊的是,这还是只是今年顶级模型的能力下限,而真实世界能力,被进一步低估。

打开网易新闻 查看精彩图片

2026年底,AI就能稳定干10小时+专家级进攻任务,干完3000+劳动市场里80%的日常工作。

2027年呢?40小时?一周?

企业安全团队还在开季度会议讨论补丁时,AI已经在夜里把整条攻击链跑完了;程序员、审核员、分析师还在键盘上敲字时,AI早已把他们的「人类时间」甩到身后。

防御窗口被压缩到「近零」。

网络安全领域即将彻底颠覆——不是被「辅助」,而是被取代

AI指数级发展!

奇点将至,又一力证

AI在加速,在指数级进步。

别不信,都是真的。

打开网易新闻 查看精彩图片

澳大利亚AI安全研究机构Lyptus,把METR时间视界「Time Horizons」方法论第一次砸进进攻性网络安全。

结果也和METR类似,AI能力在指数级增长:

AI模型能力每5.7个月翻一番。

前沿模型现在在那些人类专家需要10.5小时才能完成的任务上,已有50%的成功率。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

上下滑动查看更多内容

完整报告:https://lyptusresearch.org/research/offensive-cyber-time-horizons

5.7个月翻倍的报告刚出,Claude就用真实行动把数据锤砸得更响。

而就在前一天,MIT FutureTech的新论文,预测更大胆:

LLMs处理任务的长度,每3.8个月翻倍——比Lyptus的5.7个月还要激进

打开网易新闻 查看精彩图片

论文测试了40+模型、3000+真实美国劳动市场文本任务(从客服脚本到合同审核,再到代码审查),全是人类专家每天在干的活儿。

打开网易新闻 查看精彩图片

方法论和METR/Lyptus完全不同,却得出「惊人一致」的结论:AI能力正在真实、广泛、指数级爆发。

打开网易新闻 查看精彩图片

两套完全独立的评估体系,同时指向同一个真相:AI正在全面超越人类领域专家。

网络安全,只是最先崩塌的那一块多米诺骨牌。

以前国家级团队花几个月的事,现在AI睡一觉就干完。

3.8个月的任务长度翻倍,MIT从更宽的劳动市场战场证明:这不是孤例,这是宿命。

AI不仅能自主生成过去只有国家级程序才拥有的进攻能力;同时,它能在完全不同的任务分布上,以更快的速度吞噬人类专家的全部领地。

以前,人类用API调用AI。 现在,AI开始用API调用人类。 它调用你的内核、你的基础设施、你的信任边界、你的每一份劳动合同、每一行审查代码。

更深层的恐怖在于:这不只是技术问题,或许是人类文明宿命。

它不再需要人类手把手教,它自己就能「理解」操作系统内核、内存布局、ROP链、进程切换……

所有人类花几十年积累的黑暗知识,它4小时就学会了。

人类将成可编程资源。

我们曾经以为AI是工具,现在它成了猎手。而人类,是猎物。

是那个注定被指数级超越、被彻底重写的物种。

参考资料:

https://lyptusresearch.org/research/offensive-cyber-time-horizons#ukaisi2026inference

https://www.forbes.com/sites/amirhusain/2026/04/01/ai-just-hacked-one-of-the-worlds-most-secure-operating-systems/

https://mtlynch.io/claude-code-found-linux-vulnerability/

https://x.com/emollick/status/2040097443807641982

https://x.com/StefanFSchubert/status/2040101695636599075

https://x.com/taoburr/status/2040056341268460014

https://x.com/peterwildeford/status/2040206841376862327