OpenAI刚出的macOS版Codex,不是插件,也不是聊天框,是个能同时跑好几个“AI程序员”的桌面应用。2月3号上线那天,我下完就试了,没看教程,点开就写了个简易待办清单——前后不到两分钟,连本地SQLite都自动配好了。

打开网易新闻 查看精彩图片

它把代码仓库当试验田,可以一边改前端,一边让另一个AI查后端漏洞,互不干扰,也不用切分支、怕冲突。我以前改个功能总得先git stash一堆东西,现在直接开三个“工作树”,像开三个浏览器窗口一样自然。

它管那些功能叫“Skills”,不是命令,是能存能调的工具包。比如我选了“测试运行器+UI预览”,它就自动起本地服务、打开浏览器、点两下按钮跑交互。要是写游戏,它会自己调物理引擎、跑性能分析、再改渲染逻辑——不是瞎写,是一环扣一环地干活。

它还有两种说话方式。选“务实型”,它答得快、步骤短,适合赶工期;选“共情型”,它会多问一句“你上次改的是不是这个模块?”,记上下文比我自己还清楚。我试过故意说错需求,它没硬编,而是停下来列了三个可能方向让我挑。

跑分软件测不出它真正厉害的地方。TerminalBench只看它回命令快不快,可它真正省时间的是——从“我想做个相册”到“拖拽图片能实时上传并压缩”,中间自动拆了八步,调了五个Skills,还帮我绕过了Safari的文件API限制。

Claude Code我也装了,它像个特别懂语法的实习生,一次只盯一块代码;Codex倒像带了四五个工程师的项目经理,不光写,还排期、盯进度、自测、写文档。免费版够我日常用,Pro版解锁了更快的并行数,但说实话,我连免费版的额度都没用满过。

它没说要取代谁,只是把原来要翻文档、查报错、反复调试的那些零碎动作,全包圆了。我现在花最多时间的,反而是想清楚:“这功能到底该做成什么样?”而不是“怎么写出来”。

奥尔特曼说“爱了爱了”,我倒没那么激动,就是昨天改完一个老项目,顺手删了三个小时前写的调试脚本——因为已经用不上了。
它就是个工具,挺好用的。