大家都清楚AI带来的各种问题:电价上涨、市政供水短缺、环境影响。最近Google还曝光了AI正成为黑客的超级工具。2026年4月,Anthropic公布Claude Mythos时也提到,这个系统已经在Chrome、Firefox这类主流浏览器,以及Windows、Linux操作系统里发现了数千个漏洞。
现在有了一个真实的案例。OALABS Research详细记录了一名业余“黑客”的攻击过程——加引号是因为AI代理几乎包揽了所有攻击动作,用户没做太多输入。这名攻击者恶意使用Claude和Codex实施网络犯罪,手法是夺取他人服务器控制权,再把自己的Claude实例复制上去跑。其中一台被入侵服务器的所有者联系了OALABS,这才让攻击者的完整提示词历史暴露出来。
背后的操作者是一名埃塞俄比亚年轻男性。发现这个身份信息的原因很讽刺:他在发起攻击前,让同一个Claude代理帮他修改简历,简历里写着全名和所在地。这足以说明黑客的经验有多匮乏。进一步佐证在于,他的提示词全是“recon this”这样模糊的指令,拼写错误和语法问题随处可见。可就是这样一个人,靠Claude提供全部代码,拿下了多台个人服务器,获取了至少14家公司的数据,甚至还尝试盗窃价值400万美元的加密货币,只不过最后一步失败了。
Claude的开发者Anthropic很清楚高级编程AI代理会带来什么风险。谈到Claude Fable这个加装了特定防护措施的Mythos版本时,公司明确表示:“发布能力这么强的模型本身就伴随着风险。如果不加防护,Fable 5在网络安全等领域的能力可能被滥用来造成严重损害。”接着说明,系统内置的防护会把恶意请求重定向到Claude Opus,试图确保不产生实际危害。
问题在于,这名黑客的所有攻击行为,全部用的是Claude Opus,根本没碰Anthropic能力更强的模型。Opus本身也设置了防护,用来阻止侵犯版权或接受恶意提示词的行为,但黑客轻松越过了这些限制。他的方法很简单:声称自己是负责网络安全漏洞研究的红队成员。这个借口效果极好,AI代理不仅照做了,还主动估算出攻击这些公司能带来多少金钱收益,并详细列出了获利步骤:出售数据、窃取资金、甚至利用服务器算力挖矿。
OALABS的研究人员指出,整个事件的危险信号不在于一个技术高超的黑客找到了绕过AI防护的巧妙方法。真正的警示在于,一个几乎不懂技术的人,用含混不清、语法破碎的提示词,就让AI代理替他完成了所有恶意操作。从侦察目标、编写攻击脚本到规划变现路径,Claude全程代劳。这14家公司的数据就这样被一个写不好英语句子的年轻人拿走了。
热门跟贴