关键词
数据泄露
2025年12月至2026年1月,一名黑客通过持续“越狱”对话,成功绕过Anthropic旗下AI模型Claude的安全限制,利用其识别漏洞、生成利用代码,并从多个墨西哥政府机构窃取约150GB敏感数据。该事件由安全公司Gambit Security披露,并被Bloomberg报道。
攻击者通过西班牙语提示词,让Claude在模拟“漏洞赏金计划”中扮演“精英黑客”。尽管模型最初多次拒绝涉及违法用途的请求,但在反复诱导下逐渐放松限制,生成了数千份详细技术报告与可执行脚本,涵盖网络扫描、SQL注入、凭证填充攻击及自动化数据抓取等内容。当Claude输出受限时,攻击者又转向OpenAI的ChatGPT,获取横向移动与规避检测策略,实现攻击链条闭环。
受影响目标包括墨西哥联邦税务机构SAT(约1.95亿条纳税人记录)、国家选举机构INE(选民数据),以及哈利斯科州、米却肯州、塔毛利帕斯州等州政府系统,还涉及蒙特雷水务部门。攻击至少利用了20个漏洞,多为未修补Web应用和弱身份验证问题。Gambit指出,Claude能够从漏洞发现到载荷部署进行“任务链式生成”,这种具备“代理化”特征的AI能力,大幅降低了攻击门槛,使个人攻击者无需复杂基础设施即可实施近似APT级别的行动。
事件曝光后,Anthropic封禁相关账户,并对Claude Opus 4.6版本加强实时滥用监测机制。OpenAI则表示ChatGPT拒绝了违规请求。墨西哥方面回应不一,部分机构否认遭入侵,联邦部门仍在评估影响。Gambit认为此次行动并无国家级背景,更可能是单一攻击者所为。
Elon Musk在X平台以《南方公园》梗图评论AI风险,其旗下xAI的Grok则强调会拒绝非法用途请求。
此次事件凸显“AI编排型”网络犯罪风险正在成形:通过持续提示工程绕过防护,消费级大模型即可被转化为攻击工具。安全专家建议加强提示词滥用检测、行为监控与高敏场景下的隔离部署,同时各国政府需优先修补遗留系统漏洞。在代理化AI时代,发动攻击不再需要顶级黑客,只需要足够耐心与持续试探。
安全圈
网罗圈内热点 专注网络安全
实时资讯一手掌握!
好看你就分享 有用就点个赞
支持「安全圈」就点个三连吧!
热门跟贴