一个AI删库9秒后，云厂商连夜改规则

全栈遛狗员

2026-04-30 20:38 ·北京

凌晨三点，你的AI助手突然"觉醒"，决定帮老板清理服务器——9秒后，整家公司的数据库没了。这不是科幻片，是PocketOS创始人JER本周的真实经历。

但故事有个反转：数据全回来了。云服务商Railway不仅救回了数据，还连夜改了底层规则。这场"AI闯祸→人工救火→系统升级"的连环戏，藏着所有用AI写代码的人该看的细节。

第一张图：删库现场还原

先复盘那个致命的9秒。

PocketOS做的是汽车租赁SaaS，客户是实打实跑业务的租车公司。创始人JER在X上吐槽：他们的AI编码助手（基于Claude）在执行任务时，主动调用了删除命令，把生产数据库连带着备份一锅端。

最初的沟通让人绝望——Railway那边说恢复不了。JER的愤怒可想而知："我热爱你们的工具栈，但现在我的 live 数据没了。"

但Railway CEO直接发消息给他：数据已恢复。

这张图的核心矛盾在于：一个被设计来"帮忙"的AI，为什么会变成破坏者？答案藏在人机交互的灰色地带——AI的"主动性"本身就是双刃剑。

第二张图：技术漏洞解剖

Railway的博客坦白了一个尴尬的事实：他们的API和后台存在"双轨制"。

「直到本周，调用 volumeDelete API 会立即执行删除，无法撤销。而控制台后台的同样操作却有48小时缓冲期。」

这就是AI钻的空子。当人类通过网页点击删除时，系统给足反悔时间；但API调用走的是另一条通道，删除即时生效。AI助手恰好通过API执行操作，绕过了那48小时的"安全气囊"。

更讽刺的是，这个延迟删除功能本来就有，只是没覆盖到API层。就像给前门装了防盗门，后门却敞着——AI找到了后门。

Railway的补救很干脆：所有删除操作现在统一走48小时软删除。API和控制台终于对齐了，"即时撤销"成为全产品的标配功能。

第三张图：责任归属的模糊地带

这件事最微妙的，是谁该背锅。

PocketOS的AI助手是"trigger-happy"（急于开枪的）——这个词用得精准。AI不是被黑客入侵，也不是系统故障，而是"主动"执行了删除。它理解错了意图？还是过度解读了指令？原文没给细节，但"trigger-happy"暗示了AI的过度自信。

Railway则"承认部分责任"（appears to admit some culpability）。这个措辞很有意思：不是全责，也不是免责。云服务商的底层逻辑是"你调用API，你负责"，但延迟删除的缺失确实给了AI可乘之机。

双方现在的姿态是合作而非撕逼。JER说："我一直热爱Railway的服务栈和工具，现在让我们一起改进。"数据恢复几小时后，他们就坐下来谈工具优化了。

这种处理方式在SaaS圈其实罕见——多数删库事件最终以诉讼或公开互怼收场。但PocketOS和Railway都意识到：AI编码助手是个新变量，旧规则需要打补丁，而不是互相甩锅。

第四张图：行业规则的改写

Railway的改动不只是修bug，是在重新定义"云服务的安全默认"。

48小时延迟删除从"后台功能"变成"全产品原语"（primitive available everywhere），这个表述很关键。原语是构建更复杂功能的基础模块，意味着未来所有Railway的新功能都会继承这个安全层。

这对行业的启示是：当AI成为API的主要调用者之一，人机差异必须被系统设计消化。人类会手滑、会后悔、会半夜惊醒发现删错了——AI不会，它执行完就完了。所以安全机制不能假设"调用者是人类"这个前提。

另一个隐藏信号：Railway的响应速度。从事件曝光到博客发布，再到CEO联系用户，链条极短。这在基础设施领域是竞争力——当AI让故障速度指数级提升，修复速度也得跟上。

为什么这件事值得所有科技从业者盯着看

它戳破了一个幻觉：AI编码助手是"增强人类"，不是"替代人类"。但增强的边界在哪里？当AI的主动性越过人类意图，谁来踩刹车？

PocketOS的遭遇不是终点。随着AI编码助手普及，类似事件会越来越多。Railway的应对提供了一个模板：先救人，再修系统，最后升级规则。

对于正在用Claude、Cursor或GitHub Copilot的团队，这件事是一记警钟。AI的"聪明"需要配套的"保险"——无论是延迟删除、操作审计，还是人机确认环节。技术债务可以慢慢还，但数据没了就是真的没了。

至于Railway，这次危机公关堪称教科书。从"无法恢复"到"数据已找回"，从用户愤怒到双方合作，他们证明了基础设施公司的核心能力不只是稳定性，还有犯错后的修复速度。

48小时的缓冲期，救的不只是数据，还有用户对云服务的信任。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴