Opus 4.8刚发布,跑分全面超过GPT-5.5和Gemini 3.1 Pro,快速模式价格直接比上代便宜了三分之二。一个前沿模型,性能往上走,价格往下走,这剧情本身就够反常。但更值得琢磨的是另外两件事:dynamic workflows把任务规划从对话窗口里挪到了代码里,用户还能手动调模型的"思考强度"。一边是能力在涨,一边是控制权在往回交,这对每天跟代码打交道的开发者来说,信息量不小。

先拆dynamic workflows。它的本质是让Claude用JavaScript写一段编排脚本,把用户的需求拆成子任务,分给并行运行的subagents去干。关键变化藏在一个细节里:任务计划不再堆在Claude的上下文窗口里,中间结果全存在脚本变量里,最终只把答案送回对话。这意味着上下文不会被越拖越长的规划过程稀释掉,也不容易跑偏。subagents的并发上限是16个,单次运行总数不超过1000个,脚本本身碰不了文件系统和shell,能读写文件的是agents。进度随时保存,中断了可以在同一个session里恢复,已经跑完的agents直接返回缓存结果。

打开网易新闻 查看精彩图片

Anthropic放出的案例很有看头。Jarred Sumner用dynamic workflows把Bun从Zig移植到Rust,生成约75万行代码,测试套件通过率99.8%,从第一次commit到merge花了11天。过程是这样的:一个workflow负责给每个struct字段映射正确的Rust lifetime,下一个workflow把每个.rs文件改写成行为一致的移植版本,数百个agents并行干活,每个文件配两个reviewer,后面跟一个修复循环持续跑构建和测试,直到全部通过为止。不过Anthropic也说明了,这个结果已经合入但还没上生产。

打开网易新闻 查看精彩图片

第二个变化是思考强度控制。用户现在可以手动调高或调低Claude投入推理资源的程度。调高就"更频繁、更深入地思考",回答质量往上走;调低就更快回应用户,消耗rate limit的速度也变慢。这个设计戳中了一个挺现实的焦虑:很多人已经感觉到AI服务在通过各种额度机制变相涨价,额度消耗速度比预期快得多。现在能自己握个开关,至少知道快慢和消耗是怎么挂钩的。

价格这块,快速模式的变化最直接。Opus 4.8快速模式的速度是正常输出的2.5倍,价格降到每百万输入token 10美元、每百万输出token 50美元。对比Opus 4.7的30美元和150美元,降了整整三倍。常规模式下,Opus 4.8还是每百万输入5美元、输出25美元,跟Opus 4.7持平,而且比GPT-5.5便宜。快速模式已经在Claude Code里通过/fast命令可用,API访问还得去claude.com/fast-mode申请waitlist。企业版需管理员开通,Max和Team计划默认开启。

打开网易新闻 查看精彩图片

功能说完,有个点不容忽视。Opus 4.8在整体基准测试上压了GPT-5.5和Gemini 3.1 Pro一头,但agentic terminal coding这项,OpenAI的模型还在前面。所以不是一个模型把所有科目都考了第一的剧本,而是在开发者工作流这个具体战场上摆出了新的棋局。dynamic workflows瞄准的是大规模任务编排,fast mode卡的是延迟敏感的生产环境,方向很清楚。

最后说一下"诚实"这个事。今天的大模型竞赛里,聪明、快速、能写代码已经成了标配,难的是找到一个真能老老实实说"我不知道"的AI。第欧根尼大白天打着灯笼找诚实的人,放今天,人们大概想找的是个诚实的模型。跑分能告诉你谁能写更多代码,但没办法回答模型会不会在搞不定时硬编一个答案。Opus 4.8在跑分上拿了优势,在定价上给了诚意,但诚实这道附加题,还没人交卷。