Anthropic公司最强大的Claude模型正在迎来新的升级,该公司在周四的博客文章中表示,Claude Opus 4.6将在编程和项目创建方面表现得更加出色,一次性完成的成功率更高。
Claude Opus 4.5已经是一个强大的编程模型,其11月发布后引发了Claude Code在假期期间的病毒式传播热潮。Claude经过验证的编程实力和新的Cowork功能让华尔街感到焦虑,近几周许多科技股下跌,人们担心未来可能不再需要软件产品。
Anthropic表示,新模型更专注于解决最大的挑战,比如复杂应用程序的内部运作机制,同时也能更快地处理简单的步骤。
作为推理模型,Opus 4.6的工作原理是分解执行任务所需的步骤,制定计划后再开始执行。它还会回过头检查这些步骤的工作,有时会在不需要你要求的情况下进行多次尝试。
有时模型可能会在任务上花费过多精力,Anthropic表示可以通过将努力级别从默认的"高"设置降低来解决这个问题。
Claude Opus模型适用于Pro、Max、Team和Enterprise计划的付费Claude用户。其中最便宜的Pro计划每月费用为20美元(如果按年付费则每月17美元)。Pro计划对Opus的使用有限制,用户在几个小时的编程后可能会达到限制,然后需要等待几个小时才能重置。
除了Opus,Anthropic还有规模更小、功能稍弱的Sonnet 4.5和Haiku 4.5模型。
Claude Opus 4.6初体验
为了测试新模型,我让它创建一个通过语音操作的问答应用。这个过程经过了大约一小时的多次迭代,但Claude每次都能很快完成输出。这绝不是完全自主的——我识别故障并提供解决方案的想法,尽管我的一些建议在完全在HTML文件内构建的限制下产生了反效果。
这次体验与我之前用Opus 4.5进行类似测试时没有太大不同,尽管这次似乎稍微快一些。模型从一开始就理解了我想要做什么,这在AI项目中并不总是如此。当我告诉它要制作有挑战性的问题时,它想出的问答题制作得相当精良。大部分问题都很准确,尽管其中一道(众多)艺术史问题要求我说出艺术家的名字(爱德华·蒙克),但却告诉我正确答案是画作的标题(《呐喊》)。
速度提升的缺点是我在大约90分钟内就用完了Pro计划的使用限额——正当我让应用程序几乎无缝运行时——无法发出最后一个请求:要求一个包含100多个问题的数据库。这只能再等几个小时了。
Q&A
Q1:Claude Opus 4.6相比前一版本有哪些改进?
A:Claude Opus 4.6在编程和项目创建方面表现更出色,一次性完成的成功率更高。它更专注于解决复杂应用程序内部运作等重大挑战,同时也能更快处理简单步骤。作为推理模型,它会分解任务步骤并制定执行计划,还会主动检查和多次尝试优化结果。
Q2:Claude Opus模型的收费标准是什么?
A:Claude Opus模型适用于Pro、Max、Team和Enterprise等付费计划用户。最便宜的Pro计划每月20美元(年付17美元/月)。需要注意的是Pro计划对Opus使用有限制,用户可能在几小时编程后达到限制,需等待几小时重置。
Q3:Claude Opus 4.6的编程能力表现如何?
A:实际测试中,Claude Opus 4.6能够创建语音操作的问答应用,理解能力强,从一开始就能把握用户需求。生成的问答题质量较高,大部分准确,处理速度也比前版本有所提升,但可能因为处理速度快而更快消耗使用限额。
热门跟贴