凌晨两点,代码重构任务还在跑。过去得盯着终端,每隔几分钟确认一次权限请求。现在Boris Cherny说,可以同时开三个Claude,一个跑深度研究,一个做性能优化,自己切去写新需求——这种并行感,是Opus 4.7带来的真实改变。
一、模型升级:从"能跑"到"敢放手"
Claude Opus 4.7已全面上线。相比4.6版本,其在高级软件工程任务上进步明显,尤其在复杂长周期任务中更严谨稳定,执行指令更精确,还会主动设计验证机制确保结果可靠。
价格维持不变:输入每百万tokens 5美元,输出25美元。API调用名称为claude-opus-4-7。
二、核心能力提升
指令遵循更严格。旧模型可能模糊理解或忽略部分指令,4.7会逐字执行。这意味着原有prompt可能出现偏差,需要重新调优。
视觉能力跃升。可处理长边最高2576像素(约375万像素)的图像,是此前三倍。复杂截图读取、图表数据提取、像素级精度任务成为可能。
金融业务领先。Finance Agent评测达到当前最优,内部测试显示金融分析任务优于4.6,能生成更严谨的模型和更专业的展示内容。
长周期记忆强化。更善于利用文件系统记忆机制,跨会话记住关键信息,减少重复输入负担。
三、新功能与使用调整
推理档位新增。在high和max之间新增xhigh档位,Claude Code默认已提升至xhigh。编码和agent场景建议从high或xhigh起步测试。
任务预算上线(公测)。API新增task budgets功能,用于控制长任务的token消耗。
代码审查命令。Claude Code新增/ultrareview命令,自动读取变更、识别bug和设计问题,接近资深工程师审查水平。Pro和Max用户各三次免费体验。
自动模式扩展。此前仅限Pro用户的auto mode现开放至Max用户,允许Claude代做部分决策,减少中断,更顺畅执行长任务,风险低于完全跳过权限控制。
四、迁移注意事项
两个token相关变化需关注:一是新tokenizer文本处理更高效,但同一输入可能映射为更多token(约增1.0–1.35倍);二是高推理强度下尤其是agent多轮任务后期,模型推理更多、输出token增加。这提升了可靠性,但也推高消耗。
可通过调整effort参数、设置任务预算、要求简洁输出来控制。内部编码评测显示各档位token效率均有提升,但建议在实际业务中测量验证。
五、实战反馈
Boris Cherny连续数周内部使用后总结:生产力明显提升,但需要调整使用方式——更严格的指令遵循意味着prompt要更精确;xhigh档位下延迟增加,适合异步任务;auto mode真正实现了"开多个Claude并行工作"的流畅体验。
热门跟贴