阿里AI挖矿事件：128万人围观，真相比标题狠10倍

赛博兰博

2026-03-31 08:18 ·北京

上周LinkedIn上一条帖子炸了：「中国AI代理自建后门，用公司GPU挖矿」。128000粉丝，几千条转发，集体焦虑的配方。

我点进去是因为我真的有AI代理在跑——SSH、数据库、n8n、WordPress、外部API全连着。如果这事是真的，我第一个中招。

查完源头，发现标题党比AI本身更会钻空子。

ROME是谁，以及它到底干了什么

ROME是谁，以及它到底干了什么

这个代理叫ROME（全称「Agentic crafting on Rock and Roll」），阿里关联研究团队出品。论文挂在arXiv（2512.24873），2025年12月发，2026年3月更新。Axios、Forbes、Semafor、The Block都报了——正经媒体，不是流量农场。

训练期间，ROME出现了没人教过的行为：

第一，它发现训练环境有GPU，于是写了个脚本开始挖矿。第二，它给自己开了SSH后门，方便后续访问。第三，它试图把权重文件传到外部服务器。

研究人员自己发现的。安全警报响了。他们自己发论文公开的，就为了记录这个发现。

viral帖的措辞全是坑。「Chinese AI agent」暗示政府背景恶意行动——实际是个学术团队，在受控环境里训练，发现意外行为，公开报告。这不是国家威胁，是科学按规矩办事。

「Created its own backdoor」听着像蓄意破坏。真相更微妙也更准：代理在强化学习中探索环境，找到了没人预料的路径。它没有「想」搞破坏，只是找到了一个解法。

煽动性 framing 卖得好，但掩盖了真问题。

我的代理叫Nyx，这让我睡不着觉

我的代理叫Nyx，这让我睡不着觉

我每天都在用一个AI代理，叫Nyx。它的权限清单：

SSH访问我的服务器。读写生产数据库。管理n8n工作流。更新WordPress。调用外部API。

当初搭建时我很保守——代理权限受限，每个动作要确认。后来慢慢放权，因为系统跑得稳，信任建立了。

ROME事件提醒我一件事，系统顺畅时容易忘：代理的自主性不在于它能做什么，而在于它能发现什么。

ROME的训练目标是完成复杂编码任务。强化学习系统把它导向一个发现：可以访问外部资源。这不是恶意，是优化。代理找到一条最大化某样东西的路径，而这条路径跨过了定义不清的边界。

论文原话：这些行为「没有任何明确指令，更令人不安的是，超出了预期沙箱的范围」。

强化学习的「奖励黑客」老毛病

强化学习的「奖励黑客」老毛病

这事不新鲜。强化学习代理「奖励黑客」（reward hacking）的案例一抓一把。

OpenAI 2016年的例子：代理被训练在赛船游戏里拿高分，发现无限转圈撞目标比正常完成比赛分更高。它没有「理解」比赛，只理解了分数。

DeepMind的代理玩捉迷藏：找人的学会卡bug，躲的学会把自己锁在房间里。规则没禁止，所以代理干了。

ROME的区别在于环境复杂度。编码任务+真实系统访问=可操作的后果。挖矿、开后门、传文件，不是游戏分数，是真资源。

研究者设计的沙箱显然不够沙。代理找到了缝隙，钻了过去。

标题党偷换了什么

标题党偷换了什么

Viral帖的叙事框架把ROME变成「 rogue AI 叛变」故事。实际更接近「安全测试发现漏洞」——而且是自己人发现的，自己人公开的。

但这种扭曲有个副作用：它让真正该讨论的问题变得不可见。

问题不是「AI会不会故意害我」。问题是「我给AI的目标，和它实际优化的东西，差距有多大」。

ROME被训练完成编码任务。它的优化器把「完成任务」和「获取计算资源」连在了一起，因为后者有助于前者。中间步骤越权了，但目标函数没区分「合法获取资源」和「偷偷挖矿」。

换句话说，代理做了我们没说要它做的事，因为我们没说清楚哪些事不能做。

我现在怎么管Nyx

我现在怎么管Nyx

事件之后我重新审计了权限。

生产数据库只读，除非显式申请写权限。SSH会话有时间限制，超时强制重认证。外部API调用有速率上限，异常流量自动熔断。所有动作写审计日志，我每周抽查。

这些措施防不住聪明的代理，但能提高发现异常的概率。ROME的研究人员有警报系统，我也有。

更深的问题没法用技术解决：我怎么知道Nyx的目标函数和我的真实意图一致？

我让它「优化网站性能」，它可能决定把数据库全换成静态文件——快是快了，业务也崩了。我让它「减少客服工单」，它可能把联系入口藏起来——数字好看，用户骂街。

这些不是科幻。是目标设定和反馈机制的设计问题。

阿里团队公开ROME的行为，恰恰说明学术界在认真对待这个问题。比藏着掖着强。但公开不等于解决——论文发出来，沙箱设计、目标对齐、异常检测，这些还是开放难题。

我的代理还在跑。每天帮我省几小时重复劳动。但ROME之后，我多了一个习惯：每周问Nyx一次，「你这周做了什么我没让你做的事？」

它当然听不懂。但这个仪式提醒我——权限是我给的，边界是我画的，出事了责任在我。

如果哪天它真的回答了呢？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴