本周同一天,三位独立创作者同时发布了"Codex正在领先Claude Code"的观点。Nate B Jones和Tibo做了正面对比,结论是Codex已成为日常主力工具。Chase AI的"该切换了吗?"工作坊也在同一天上线。第三位创作者在Medium发文,称Codex的/goal命令和4倍token效率让选择变得显而易见。三人,同一方向,同一天。
与此同时,r/ClaudeAI上一篇帖子获得数千点赞,触及这场竞争背后的情绪内核:开发者厌倦了审查那些并非自己发起的AI生成PR。开源圈的Brian Douglas在Substack发文"死于千次AI拉取请求",用不同措辞表达了同样观点。关键转折点不是"Codex赢了",而是"agent-PR审查循环已崩,我们正在摸索哪个agent适合循环中的哪个位置"。
过去14天实际发生了什么
三件事在2026年5月窗口期落地。
第一,Codex的/goal命令跨越了自主性阈值。此前Codex的自主循环运行20-30分钟后就会漂移。5月版本收紧了计划-执行-测试-审查周期,现在能在合适任务上维持数小时自主会话——代码库级迁移、依赖升级、测试补全。The New Stack在真实Python代码库上测试后称其为"迄今最强的Claude Code竞争对手",明确将其框定为日常工具切换,而非基准测试胜利。基准数据随之变动:GPT-5.5以88.7%领先SWE-bench Verified,略高于Claude Opus 4.7的87.6%,Terminal-Bench则以82.7%领先。
第二,成本差距单向扩大。一份广泛流传的Express.js重构基准显示,相同任务Codex约15美元,Claude Code约155美元——10倍差距。单任务token消耗差异已不再微妙。对于每天运行4-8小时编码agent的小团队,这相当于每月200美元与2000美元的区别。数学上,切换成本现在可在单个计费周期内收回。
第三,Anthropic技能生态持续累积。即便Codex在日常工具机制上领先,Anthropic仍推出了Code Review,技能目录竞赛继续向Claude生态倾斜。Mitchell Hashimoto的技能栈、tech-leads-club agent技能注册表、obra/superpowers都位于Claude轨道。当日常工具偏好转移时,这个生态不会随之移动。它是独立护城河,运行在独立时间线上。
三件事变了,一件事没变。"Codex赢了"的共识读的是前三个信号,但第四个信号决定了这是否只是工具切换,还是工作流重构。
热门跟贴