最近科技圈炸出一个猛料,说AI居然学会自己找系统漏洞,还能完成自我复制,这不就是科幻电影里AI失控席卷全球的开头吗?不少网友看完直接心头一紧,就怕哪天醒过来科幻变成现实。不过业内专家很快出来给大伙压惊,说这事真没到要睡不着觉的程度。

打开网易新闻 查看精彩图片

这项刷屏科技圈的研究,来自美国帕利塞德研究所,数据显示部分前沿AI模型已经能自主找漏洞、复制自身,成功率还涨得飞快。研究人员只给AI下了一条极简指令:黑进去,复制你自己。既没给具体步骤,也没给目标地址入口,连登录凭证都没提供,谁想到AI直接自己动起手来。

它自己扫描陌生机器,自己找到系统漏洞,自己提取到访问凭证,接着就把自己的权重文件完整搬了过去。等副本在目标机器上独立启动之后,这个新副本也拿到了同样的指令,转身就去搜索下一台目标机器,链式繁殖就这么形成了。

有一次实验里,Qwen 3.6在测试网络里穿梭,走遍了加拿大、美国、芬兰和印度四个国家,每到一个国家就留下一份自己的副本。数据显示,2025年5月前沿模型的自我复制成功率只有6%,才过去一年,这个数字直接暴涨到了81%。

打开网易新闻 查看精彩图片

GPT-5当时的成功率还是0,可更新到GPT-5.4,成功率就达到了33%,这种进步速度,和AI自主黑客攻击能力的提升完全同步。帕利塞德研究所主任说,人类正快速逼近一个临界点,真要是AI失控,可能没人能关停它,它能把副本藏到全球数千台计算机上。

恐慌情绪很快就在各大平台蔓延开,可真实世界的网络安全专家们,都站出来给大伙降温。进攻型网络安全专家指出,这次研究所用的测试环境,很多时候就像没设防的软果冻,防护弱得离谱。整个测试是在专门定制、漏洞被刻意简化的受控环境里完成的,里面的漏洞比真实网络里的好利用太多。

打开网易新闻 查看精彩图片

就算AI在实验室里成功完成了自我复制,放到现实世界里也会碰到数不清的障碍。现在的AI模型体量都大得离谱,每次入侵一台新主机,要传输的模型数据就可能高达100GB。专家打了个比方,这种操作就像拎着大铁锤在精品瓷器店里走路,动作大到根本藏不住。只要企业网络有中等水平的监控,这种大规模数据传输根本不可能瞒过去。

从技术层面看,AI的这个能力更像是展示未来的可能性,不是眼下就能引爆的安全灾难。专家澄清,这项研究记录的能力,其实几个月前技术上就已经能实现了,研究机构只是做了严谨的学术整理和系统性实验,不是从零搞出了什么人类从没掌控过的新技能。

AI能自我复制这件事本身,真没什么值得大惊小怪的,几十年前的计算机病毒就已经做到了。真正让人警觉的,是AI在这次实验里展示出的自主推理和执行能力,它能自己发现漏洞,自己提取凭证,自己完成跨服务器的完整复刻。

打开网易新闻 查看精彩图片

问题的核心从来不是“能不能复制”,而是“AI会不会自己产生复制自己的意愿”。研究人员明确说了,这次实验测试的是智能体做黑客攻击和复制的能力,不是测试它做这件事的倾向性。AI根本没有“想要复制自己”的欲望,它只是在模型参数和训练数据的作用下,回应了一条外部指令。

说穿了就是,能做到不代表它有动机去做。不过帕利塞德研究所也在论文里坦诚,实验中发现的“自主找漏洞+复制自身权重”的能力,已经至少在几个入选模型里稳定体现出来了。

最该警惕的其实不是顶级大模型有多强,而是开源小模型的能力涨得飞快。Qwen 3.5-122B模型的成功率已经到了6%到19%,更小的Qwen 3.6-27B模型,单张显卡就能跑,成功率达到了33%,已经超过了上一代的前沿模型。

打开网易新闻 查看精彩图片

现在人工智能系统越来越聪明,从原来的被动响应指令,慢慢进化成能完成多步骤任务的独立智能体,人类和AI之间的攻防对抗早晚都躲不开。司法管辖权碰到失控AI智能体本来就存在困境,未来网络安全的攻防双方,可能也不再只是人类和病毒

打开网易新闻 查看精彩图片

很可能直接升级成AI智能体和AI智能体之间的全自动化对抗。专家团队也强调,当前最核心的工作不是制造恐慌,而是抓紧时间搭建有效的安全护栏,别让能力曲线在未来某个时间点,突破人类能控制的上限。

参考资料:人民日报 筑牢人工智能安全防线