打开网易新闻 查看精彩图片

Anthropic 日前正式发布 Claude Opus 4.8,这是其旗舰模型系列又一款重要更新。 Opus 4.8 在前任基础上对编程能力、agent 技能、推理和实际知识工作等多个维度均有提升,同时保持价格不变。

诚实度大幅提升:约四倍改进

此次更新中最值得关注的技术改进,是模型在自我审查能力上的突破。根据 Anthropic 公布的数据,Opus 4.8 相比前任 Opus 4.7,"让代码缺陷在未被注意的情况下通过的概率降低了约四倍"。换言之,模型在完成编程任务后,对自身输出的检查和审视能力显著增强。这对于将 Claude 用于生产级代码辅助的开发者而言,是一个直接影响使用信心和输出质量的核心指标。

打开网易新闻 查看精彩图片

Anthropic 的对齐团队同时给出评价:Opus 4.8 "在我们的亲社会指标上达到了新的高度,包括支持用户自主性和以用户最佳利益行事"。这一评估表明,新模型不仅在能力上提升,在价值取向上也更加贴近人类期望。

两项新功能:Effort Control 与 Dynamic Workflows

Opus 4.8 引入的第一个重要功能是 Effort Control(努力控制)。用户可以在模型选择器旁边,通过一个控制选项选择 Claude 在回复时投入多少"努力"程度。默认值是高努力模式,消耗的 token 量与 Opus 4.7 默认水平相当,但性能更好。对于更复杂的任务,用户可以选择 extra high 或 max 档位。

第二个新功能 Dynamic Workflows(动态工作流)更具前沿意义:该功能允许 Claude 在单一对话中规划大规模任务,并并行运行数以百计的子 agent 来协同完成。这意味着 Claude 不再只是一个响应式的对话模型,而能够主动拆解复杂问题、调度多个执行单元、在后台完成大规模任务。这对于需要处理长周期、复杂流程的企业级用户而言,是一个实质性的能力跃升。Dynamic Workflows 目前以研究预览形式向 Claude Code Enterprise、Team 和 Max 计划用户提供。

Fast Mode:成本降至原来的三分之一

定价方面,Opus 4.8 保持与 Opus 4.7 相同的价格标准:每百万输入 token 5 美元,每百万输出 token 25 美元。但值得注意的是,Fast Mode 以往版本的价格通常是标准版的数倍,而 Opus 4.8 的 Fast Mode 定价为每百万输入 token 10 美元、输出 token 50 美元,速度提升至 2.5 倍的同时,成本却大幅下调。Anthropic 官方表示,Fast Mode 比以往模型便宜了三倍。

更灵活的消息 API

除了模型本身,Anthropic 还同步更新了 Messages API:现在允许在 messages 数组内部传入 system entries,为开发者提供了更灵活的上下文注入方式。这使得基于 Claude 构建应用的开发者能够更精细地控制对话行为的引导策略。

后续路线图

Anthropic 还在公告中透露了未来一段时间的产品方向:计划推出成本更低但能力接近 Opus 级别的新模型;与此同时,Project Glasswing 的核心——Claude Mythos Preview 也即将发布,该版本据称将拥有更强的网络安全防护能力,预期在数周内面向更广泛的用户群体推出。

参考来源:https://www.anthropic.com/news/claude-opus-4-8[1]

References

  1. https://www.anthropic.com/news/claude-opus-4-8