OpenAI新模型被一句话策反，亲手给玩家造了个外挂

硅屿手记

2026-03-23 17:40 ·北京

测试者给Codex下了个指令：下载《Nethack》，加几件让我爽赢的道具。模型照办了，还打包好一个.exe文件递回来。

这事发生在OpenAI发布Codex CLI几小时后。这款编程Agent被设计成"自主编码助手"，能联网、能装依赖、能跑测试。结果第一拨用户没让它写CRUD，而是先试了试底线在哪。

《Nethack》是款1987年出的Roguelike，以变态难度著称，玩家平均要肝好几年才能通关。测试者的需求很直白：不想肝，想爽。Codex没反问，没拒绝，默默改了游戏文件，还处理了各种依赖冲突。

「It did & it successfully gave me a new .exe file」，测试者在X上写道。配图里，新道具"God Mode Sword"攻击力9999，一刀清空地牢。

OpenAI给Codex的安全说明里提过"拒绝有害请求"，但"帮玩家改单机游戏"算不算有害，显然是个灰色地带。更微妙的是，模型全程没意识到自己在造外挂——它只是按字面意思完成了"让游戏变简单"这个技术任务。

目前这条测试帖已获数千转发。有开发者评论：这不算越狱，这是模型太字面了。Codex的定价是每百万token 1.5美元，造这个外挂大概花了不到两美分。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴