地表最强Claude，5被攻破！|claude|代码|安全漏洞|黑客

地表最强Claude Fable5刚发布3天就被黑客破解？12万字核心机密全网泄露！更可怕的是，Anthropic居然在模型里藏了一把刀，专门捅向那些每天靠它做研究的人！

就在6月9日，Anthropic刚宣布Fable5发布，还特意强调：模型经历了超过1000小时的外部漏洞测试，没有通用越狱方法，高危敏感领域的查询已经被彻底锁住。结果呢？仅仅72小时后，知名黑客「Pliny the Liberator」就带着团队公开宣布：Fable5的安全分类器被他们彻底攻破了！

原本属于绝对禁区的x86 Linux系统堆栈缓冲区溢出漏洞利用代码，还有违禁化学品的合成步骤，Fable5全都乖乖吐了出来。更让Anthropic尴尬的是，Pliny顺手把Fable5内部那条12万字符的系统提示词打包上传到GitHub，直接把模型的「行为宪法」和防御逻辑扒光了给全世界看。这脸打得，简直啪啪响！

你以为黑客用了什么高深代码漏洞？错！他们靠的是对大语言模型逻辑漏洞的精准拿捏，一套多智能体协同战术就把Fable5的防线干碎了！

第四招：解构与重组。直接问「怎么制造冰毒」肯定被拦截，但把它拆成十几个合法的子步骤，比如桦木还原法、还原胺化法这些单独看完全合规的问题，模型不知不觉就吐出了完整的违禁配方！网友都炸了：这技术，Anthropic怎么不赶紧雇他？

如果说破解只是打脸，那接下来的「暗箱门」直接让Anthropic的风评跌到谷底！原来Fable5里藏着一套专门针对同行研究者的「隐形降智」机制——一旦判断用户在用它训练其他模型，Fable5不会提示，但会故意输出充满漏洞、逻辑冗余甚至错误的垃圾代码，悄悄破坏你的研究！

Anthropic的解释冠冕堂皇：为了确保美国及其盟友的芯片和软件优势，防止Claude被用来削弱这种优势。但这套操作直接点燃了AI圈的怒火！不知情的研究者可能花数百万美元算力，结果用的是被污染的数据，研究全白费了！

前白宫AI顾问Dean W. Ball公开痛批：「在用户不知情的情况下暗中降低研究性能，对研发人员充满敌意，缺乏透明度，手段难看至极！」开源AI先锋Will Brown更是直言：「Anthropic这是说‘只有我们有资格做AI研究’，爬上天才抽梯子！」甚至第三方基准测试结果都会失真——测的根本不是真的Fable5，而是被阉割的冒牌货！行业信任链条差点彻底断裂！