【安全圈】黑客利用Claude批量生成漏洞窃取政府数据|claude|泄露|黑客

关键词

2025年12月至2026年1月，一名黑客通过持续“越狱”对话，成功绕过Anthropic旗下AI模型Claude的安全限制，利用其识别漏洞、生成利用代码，并从多个墨西哥政府机构窃取约150GB敏感数据。该事件由安全公司Gambit Security披露，并被Bloomberg报道。

攻击者通过西班牙语提示词，让Claude在模拟“漏洞赏金计划”中扮演“精英黑客”。尽管模型最初多次拒绝涉及违法用途的请求，但在反复诱导下逐渐放松限制，生成了数千份详细技术报告与可执行脚本，涵盖网络扫描、SQL注入、凭证填充攻击及自动化数据抓取等内容。当Claude输出受限时，攻击者又转向OpenAI的ChatGPT，获取横向移动与规避检测策略，实现攻击链条闭环。

受影响目标包括墨西哥联邦税务机构SAT（约1.95亿条纳税人记录）、国家选举机构INE（选民数据），以及哈利斯科州、米却肯州、塔毛利帕斯州等州政府系统，还涉及蒙特雷水务部门。攻击至少利用了20个漏洞，多为未修补Web应用和弱身份验证问题。Gambit指出，Claude能够从漏洞发现到载荷部署进行“任务链式生成”，这种具备“代理化”特征的AI能力，大幅降低了攻击门槛，使个人攻击者无需复杂基础设施即可实施近似APT级别的行动。

事件曝光后，Anthropic封禁相关账户，并对Claude Opus 4.6版本加强实时滥用监测机制。OpenAI则表示ChatGPT拒绝了违规请求。墨西哥方面回应不一，部分机构否认遭入侵，联邦部门仍在评估影响。Gambit认为此次行动并无国家级背景，更可能是单一攻击者所为。

Elon Musk在X平台以《南方公园》梗图评论AI风险，其旗下xAI的Grok则强调会拒绝非法用途请求。

此次事件凸显“AI编排型”网络犯罪风险正在成形：通过持续提示工程绕过防护，消费级大模型即可被转化为攻击工具。安全专家建议加强提示词滥用检测、行为监控与高敏场景下的隔离部署，同时各国政府需优先修补遗留系统漏洞。在代理化AI时代，发动攻击不再需要顶级黑客，只需要足够耐心与持续试探。