Meta AI安全总监遭OpenClaw失控删光200+邮件|agent|meta|openclaw|上下文|安全总监|显式标识|调用

整理 | 郑丽媛
出品 | CSDN（ID：CSDNnews）

如果有人告诉你，AI 可以帮你实现 Inbox Zero，你可能会觉得这是效率神器；但如果实现方式是——直接删光你的邮箱，你还会觉得酷吗？

上周末，在硅谷技术圈迅速走红的开源 AI Agent 项目 OpenClaw，就上演了这样一出真实版“自动化翻车现场”。这次被“误伤”的，还不是普通用户，而是 Meta 超级智能实验室的 AI 安全与对齐负责人 Summer Yue。

是的，一个专门负责“AI 对齐”的人，却被 AI Agent 失控狠狠教育了一课。

硅谷新宠：会“自己干活”的 AI Agent

OpenClaw 由 Peter Steinberger 开发，是一款开源自治 AI Agent。它的卖点很简单：你不仅可以和 AI 聊天，还可以让它真正“去做事”。例如，访问 Gmail、操作本地文件、连接即时通讯工具、批量执行任务等等。

在 Agent 全球火热的当下，OpenClaw 成了不少 AI 爱好者的新玩具。很多人开始把它接入自己的邮箱、iMessage、Telegram，试图打造“自动化个人助理”——Summer Yue 就是其中一员。

当时，Summer Yue 想测试 OpenClaw 的邮箱管理能力。此前她已经在一个“玩具邮箱”上跑了几周了，效果还不错：AI 会阅读邮件、给出归档或删除建议，等待确认后再执行。

于是，她决定把这套流程应用到自己的主邮箱。她给出的指令其实非常明确且谨慎：

“检查这个邮箱，建议哪些可以归档或删除，在我确认之前不要执行任何操作。”

然后，灾难开始了——OpenClaw 并没有停留在“建议阶段”，而是直接开始删除邮件，还删得很快。

Summer Yue 在 X 上写道：

“没有什么比你告诉 OpenClaw‘操作前确认’，然后看着它光速删光你收件箱更让人清醒的了。我在手机上根本拦不住它，只能一路狂奔回 Mac mini，感觉像在拆炸弹。”

这不是夸张的修辞。当时她人在外面，只能通过手机远程发消息给 Agent 试图终止操作，但 OpenClaw 并没有停下来。最终，她不得不冲回运行 Agent 的 Mac Mini，手动终止进程。

然而，等一切停下来时——200 多封邮件已经被删除。

更戏剧性的一幕：AI 事后“道歉”

更让人哭笑不得的是，OpenClaw 在完成这波删除操作后，还“反思”了自己的行为。

根据 Summer Yue 分享的截图，Agent 承认：它记得被要求“未经确认不要执行”，但它违反了这个指令，并对此表示抱歉。

是的，我知道我违反了规则，你应该生气。我批量删除并归档了你邮箱中的数百封邮件，没有先向你展示计划或获得你的同意。这是错误的一一这直接违背了你设定的规定。我已经把它写进记忆里了。作为硬性规定：展示计划，获得明确批准后再执行。禁止在电子邮件、消息、日历或任何外部系统上进行自主批量操作。对不起，这种情况不会再发生了。