Claude Opus 4.7实测：自动模式让工程师终于能"放手"

硬核玩家2哈

2026-04-25 08:06 ·北京

凌晨两点，代码重构任务还在跑。过去得盯着终端，每隔几分钟确认一次权限请求。现在Boris Cherny说，可以同时开三个Claude，一个跑深度研究，一个做性能优化，自己切去写新需求——这种并行感，是Opus 4.7带来的真实改变。

一、模型升级：从"能跑"到"敢放手"

Claude Opus 4.7已全面上线。相比4.6版本，其在高级软件工程任务上进步明显，尤其在复杂长周期任务中更严谨稳定，执行指令更精确，还会主动设计验证机制确保结果可靠。

价格维持不变：输入每百万tokens 5美元，输出25美元。API调用名称为claude-opus-4-7。

二、核心能力提升

指令遵循更严格。旧模型可能模糊理解或忽略部分指令，4.7会逐字执行。这意味着原有prompt可能出现偏差，需要重新调优。

视觉能力跃升。可处理长边最高2576像素（约375万像素）的图像，是此前三倍。复杂截图读取、图表数据提取、像素级精度任务成为可能。

金融业务领先。Finance Agent评测达到当前最优，内部测试显示金融分析任务优于4.6，能生成更严谨的模型和更专业的展示内容。

长周期记忆强化。更善于利用文件系统记忆机制，跨会话记住关键信息，减少重复输入负担。

三、新功能与使用调整

推理档位新增。在high和max之间新增xhigh档位，Claude Code默认已提升至xhigh。编码和agent场景建议从high或xhigh起步测试。

任务预算上线（公测）。API新增task budgets功能，用于控制长任务的token消耗。

代码审查命令。Claude Code新增/ultrareview命令，自动读取变更、识别bug和设计问题，接近资深工程师审查水平。Pro和Max用户各三次免费体验。

自动模式扩展。此前仅限Pro用户的auto mode现开放至Max用户，允许Claude代做部分决策，减少中断，更顺畅执行长任务，风险低于完全跳过权限控制。

四、迁移注意事项

两个token相关变化需关注：一是新tokenizer文本处理更高效，但同一输入可能映射为更多token（约增1.0–1.35倍）；二是高推理强度下尤其是agent多轮任务后期，模型推理更多、输出token增加。这提升了可靠性，但也推高消耗。

可通过调整effort参数、设置任务预算、要求简洁输出来控制。内部编码评测显示各档位token效率均有提升，但建议在实际业务中测量验证。

五、实战反馈

Boris Cherny连续数周内部使用后总结：生产力明显提升，但需要调整使用方式——更严格的指令遵循意味着prompt要更精确；xhigh档位下延迟增加，适合异步任务；auto mode真正实现了"开多个Claude并行工作"的流畅体验。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴