2026年4月第一周,三家公司的产品自发撞在了一起。Cursor发布"Glass"版本,OpenAI给Claude Code做了官方插件,早期用户开始把三个工具同时开进工作流——没人设计过这种用法,但账单已经来了。
三个产品,三条独立路线
Cursor 3.0(代号"Glass")4月2日上线。核心变化是Agents Window,取代旧版Composer,支持多代理并行运行。一个代理重构模块,一个写测试,一个更新文档,三线程同时推进。本地计算和云端算力可以自动切换,重活扔给Cursor的服务器。
据devtoolpicks 2026年4月评测,Cursor Pro档位月费维持在20美元基础价,重度使用实际支出落在40-50美元区间。
Claude Code保持终端原生设计,在agentic coding基准测试中仍是头部表现。Anthropic的CLI不做IDE,它活在终端里,只要你需要就能一直跑,最适应的场景是:你给了清晰计划,它拿到了shell权限。
Codex CLI是OpenAI的终端编码器。据thoughts.jock.pl 2026年的测试数据,它在SWE-bench Verified上得分77.3%,Claude Code是80.8%,但token成本大约低3-4倍。然后OpenAI推出了codex-plugin-cc——一个能在Claude Code内部运行的官方插件。你现在可以用Anthropic的框架调用OpenAI的模型处理便宜任务,再切回Claude处理它擅长的部分。
这就是现状:三家公司的工具被用户硬拧成一套,没有总设计师。
真需求还是假忙碌
同时跑三个工具有三个站得住脚的理由,也有很多站不住脚的。
理由一:Cursor的并行代理适合"浅而广"的任务。Agents Window确实擅长同时推进3-5个小任务——"更新所有文件的import路径"、"给这12个模块加类型提示"、"为service/下的每个公开方法生成单元测试桩"。早上启动代理,去干别的,回来审一批PR。Claude Code也能做,但只能串行。任务可并行、深度要求低时,Cursor的挂钟时间更优。
理由二:Claude Code适合"一次一件深活"。遇到单一难题——"缓存失效逻辑有问题,找出来修掉"——终端里的Claude Code比Agents Window好用。终端上下文无边界,工具集统一,代理不会被IDE状态分散注意力。长任务不会超时,你可以离开几小时回来继续。
理由三:Codex插件填补成本缝隙。OpenAI的插件让Claude Code能按需调用Codex处理token敏感型任务——批量格式化、大文件搜索替换、生成脚手架代码。Claude Code保持主控,Codex当廉价劳动力。
但"三开"也有很多噪音。有些团队付三家钱只是为了感觉自己在做事。三个界面切来切去,上下文碎片化,实际产出未必比单工具深耕高。
同一任务的账单对比
原文提供了一组实测数据:一个中等复杂度的功能实现任务(约500行代码变更,含测试)。
纯Claude Code方案:约2.8小时交互时间,消耗约$4.20的token费用。优势是深度推理可靠,劣势是串行等待。
纯Cursor方案:约1.5小时挂钟时间(并行代理),消耗约$6.80(含云端代理计算费)。优势是并行推进,劣势是代理间协调开销,偶尔需要人工介入解决冲突。
三工具混用方案:Claude Code主导架构设计,Cursor并行生成测试桩和类型定义,Codex插件处理批量格式化。总挂钟时间约1.2小时,总费用约$5.40。时间最优,但配置复杂度最高,需要人工切分任务边界。
数据说明:混用不是免费午餐。省下的时间一部分来自并行化,一部分来自把便宜任务塞给便宜模型。但任务切分本身消耗认知资源,小团队可能得不偿失。
谁该这么用
三工具混用有明确的适用边界。
适合的场景:代码库规模大(10万行以上),任务天然可拆分,团队有专人负责工作流维护,对token成本敏感但时间成本更敏感。
不适合的场景:小团队(3人以下),任务耦合度高,缺乏专职的"AI工作流工程师",或者团队还在争论该用哪个单一工具。
一个判断标准:如果你说不清楚每个工具在任务中的具体分工,三开就是过度配置。如果你能用一句话说明"Cursor跑并行生成,Claude Code做深度调试,Codex插件填缝",才值得尝试。
为什么这件事值得跟踪
这个意外组合暴露了一个行业趋势:AI编程工具正在从"全能选手"转向"分工协作"。没有单一产品能在并行广度、深度推理、成本控制三个维度同时最优,用户被迫自己做集成。
短期看,这是效率优化者的套利空间。长期看,要么出现真正的 orchestration 层(协调层)来统一管理多工具调用,要么大厂互相封锁生态,迫使用户站队。目前三家公司的API策略都偏向开放,窗口期还在。
对技术团队的具体建议:先在一个真实任务上跑通单工具极限,再评估多工具混用的边际收益。不要从三开起步,要从"这个任务哪个工具最慢"起步。
热门跟贴