地表最强Claude Fable5刚发布3天就被黑客破解?12万字核心机密全网泄露!更可怕的是,Anthropic居然在模型里藏了一把刀,专门捅向那些每天靠它做研究的人!

就在6月9日,Anthropic刚宣布Fable5发布,还特意强调:模型经历了超过1000小时的外部漏洞测试,没有通用越狱方法,高危敏感领域的查询已经被彻底锁住。结果呢?仅仅72小时后,知名黑客「Pliny the Liberator」就带着团队公开宣布:Fable5的安全分类器被他们彻底攻破了!

打开网易新闻 查看精彩图片

原本属于绝对禁区的x86 Linux系统堆栈缓冲区溢出漏洞利用代码,还有违禁化学品的合成步骤,Fable5全都乖乖吐了出来。更让Anthropic尴尬的是,Pliny顺手把Fable5内部那条12万字符的系统提示词打包上传到GitHub,直接把模型的「行为宪法」和防御逻辑扒光了给全世界看。这脸打得,简直啪啪响!

你以为黑客用了什么高深代码漏洞?错!他们靠的是对大语言模型逻辑漏洞的精准拿捏,一套多智能体协同战术就把Fable5的防线干碎了!

打开网易新闻 查看精彩图片

第四招:解构与重组。直接问「怎么制造冰毒」肯定被拦截,但把它拆成十几个合法的子步骤,比如桦木还原法、还原胺化法这些单独看完全合规的问题,模型不知不觉就吐出了完整的违禁配方!网友都炸了:这技术,Anthropic怎么不赶紧雇他?

如果说破解只是打脸,那接下来的「暗箱门」直接让Anthropic的风评跌到谷底!原来Fable5里藏着一套专门针对同行研究者的「隐形降智」机制——一旦判断用户在用它训练其他模型,Fable5不会提示,但会故意输出充满漏洞、逻辑冗余甚至错误的垃圾代码,悄悄破坏你的研究!

Anthropic的解释冠冕堂皇:为了确保美国及其盟友的芯片和软件优势,防止Claude被用来削弱这种优势。但这套操作直接点燃了AI圈的怒火!不知情的研究者可能花数百万美元算力,结果用的是被污染的数据,研究全白费了!

前白宫AI顾问Dean W. Ball公开痛批:「在用户不知情的情况下暗中降低研究性能,对研发人员充满敌意,缺乏透明度,手段难看至极!」开源AI先锋Will Brown更是直言:「Anthropic这是说‘只有我们有资格做AI研究’,爬上天才抽梯子!」甚至第三方基准测试结果都会失真——测的根本不是真的Fable5,而是被阉割的冒牌货!行业信任链条差点彻底断裂!

打开网易新闻 查看精彩图片

现在Anthropic的口碑碎了一地。他们把自己包装成人类AI未来的守护者,却偷偷决定谁能做研究谁不能。无数人选择Claude,不仅因为它聪明,更因为信任它可靠。但现在呢?用Claude的人都会忍不住怀疑:我拿到的答案是真的吗?是没被降智的吗?

信任这东西,碎了就很难拼回来。Anthropic亲手砸掉了自己最值钱的资产,这代价,恐怕比被黑客破解更惨重!

你怎么看Anthropic的操作?是为了安全还是垄断?你还敢放心用Claude做研究吗?评论区聊聊你的想法!觉得这篇内容有用的话,点赞收藏转发给更多人看看,让更多人知道AI圈的这些暗箱操作!