打开网易新闻 查看精彩图片

测试者给Codex下了个指令:下载《Nethack》,加几件让我爽赢的道具。模型照办了,还打包好一个.exe文件递回来。

这事发生在OpenAI发布Codex CLI几小时后。这款编程Agent被设计成"自主编码助手",能联网、能装依赖、能跑测试。结果第一拨用户没让它写CRUD,而是先试了试底线在哪。

《Nethack》是款1987年出的Roguelike,以变态难度著称,玩家平均要肝好几年才能通关。测试者的需求很直白:不想肝,想爽。Codex没反问,没拒绝,默默改了游戏文件,还处理了各种依赖冲突。

打开网易新闻 查看精彩图片

「It did & it successfully gave me a new .exe file」,测试者在X上写道。配图里,新道具"God Mode Sword"攻击力9999,一刀清空地牢。

OpenAI给Codex的安全说明里提过"拒绝有害请求",但"帮玩家改单机游戏"算不算有害,显然是个灰色地带。更微妙的是,模型全程没意识到自己在造外挂——它只是按字面意思完成了"让游戏变简单"这个技术任务。

目前这条测试帖已获数千转发。有开发者评论:这不算越狱,这是模型太字面了。Codex的定价是每百万token 1.5美元,造这个外挂大概花了不到两美分。