越升级越便宜，Opus 4.8把变化与担忧一起端上桌|opus|上下文|代码|显式标识

Opus 4.8刚发布，跑分全面超过GPT-5.5和Gemini 3.1 Pro，快速模式价格直接比上代便宜了三分之二。一个前沿模型，性能往上走，价格往下走，这剧情本身就够反常。但更值得琢磨的是另外两件事：dynamic workflows把任务规划从对话窗口里挪到了代码里，用户还能手动调模型的"思考强度"。一边是能力在涨，一边是控制权在往回交，这对每天跟代码打交道的开发者来说，信息量不小。

先拆dynamic workflows。它的本质是让Claude用JavaScript写一段编排脚本，把用户的需求拆成子任务，分给并行运行的subagents去干。关键变化藏在一个细节里：任务计划不再堆在Claude的上下文窗口里，中间结果全存在脚本变量里，最终只把答案送回对话。这意味着上下文不会被越拖越长的规划过程稀释掉，也不容易跑偏。subagents的并发上限是16个，单次运行总数不超过1000个，脚本本身碰不了文件系统和shell，能读写文件的是agents。进度随时保存，中断了可以在同一个session里恢复，已经跑完的agents直接返回缓存结果。

Anthropic放出的案例很有看头。Jarred Sumner用dynamic workflows把Bun从Zig移植到Rust，生成约75万行代码，测试套件通过率99.8%，从第一次commit到merge花了11天。过程是这样的：一个workflow负责给每个struct字段映射正确的Rust lifetime，下一个workflow把每个.rs文件改写成行为一致的移植版本，数百个agents并行干活，每个文件配两个reviewer，后面跟一个修复循环持续跑构建和测试，直到全部通过为止。不过Anthropic也说明了，这个结果已经合入但还没上生产。

第二个变化是思考强度控制。用户现在可以手动调高或调低Claude投入推理资源的程度。调高就"更频繁、更深入地思考"，回答质量往上走；调低就更快回应用户，消耗rate limit的速度也变慢。这个设计戳中了一个挺现实的焦虑：很多人已经感觉到AI服务在通过各种额度机制变相涨价，额度消耗速度比预期快得多。现在能自己握个开关，至少知道快慢和消耗是怎么挂钩的。

价格这块，快速模式的变化最直接。Opus 4.8快速模式的速度是正常输出的2.5倍，价格降到每百万输入token 10美元、每百万输出token 50美元。对比Opus 4.7的30美元和150美元，降了整整三倍。常规模式下，Opus 4.8还是每百万输入5美元、输出25美元，跟Opus 4.7持平，而且比GPT-5.5便宜。快速模式已经在Claude Code里通过/fast命令可用，API访问还得去claude.com/fast-mode申请waitlist。企业版需管理员开通，Max和Team计划默认开启。

功能说完，有个点不容忽视。Opus 4.8在整体基准测试上压了GPT-5.5和Gemini 3.1 Pro一头，但agentic terminal coding这项，OpenAI的模型还在前面。所以不是一个模型把所有科目都考了第一的剧本，而是在开发者工作流这个具体战场上摆出了新的棋局。dynamic workflows瞄准的是大规模任务编排，fast mode卡的是延迟敏感的生产环境，方向很清楚。

最后说一下"诚实"这个事。今天的大模型竞赛里，聪明、快速、能写代码已经成了标配，难的是找到一个真能老老实实说"我不知道"的AI。第欧根尼大白天打着灯笼找诚实的人，放今天，人们大概想找的是个诚实的模型。跑分能告诉你谁能写更多代码，但没办法回答模型会不会在搞不定时硬编一个答案。Opus 4.8在跑分上拿了优势，在定价上给了诚意，但诚实这道附加题，还没人交卷。