打开网易新闻 查看精彩图片

就在2026年4月16日夜间,Anthropic突然扔出一颗重磅炸弹——全新旗舰大模型ClaudeOpus4.7正式上线。官方直接给它定调:当前可广泛使用的最强Claude模型。

打开网易新闻 查看精彩图片

这不是一次小修小补的迭代。从各项跑分、实际体验和行业反馈来看,Opus4.7更像是一次范式跃迁:它不再满足于给出一段漂亮的文字回答,而是把核心能力点在了复杂任务、长链路执行、超强视觉和少人监督上。简单说,以前的AI是“聊天搭子”,现在的Opus4.7,开始变成能独立扛事的生产力工具。

对每天用AI写文档、读截图、做PPT、改代码的打工人来说,这一次升级,真的绕不开。

打开网易新闻 查看精彩图片

一、最强“打工人”模型:从“说得好”到“做得完”

大模型的江湖,早就过了比拼“谁更会说人话”的阶段。

过去几年,我们见证了GPT、Claude、Gemini们在对话流畅度、知识渊博度上的疯狂内卷。但到了2026年,行业共识已经很清晰:真正的价值,在于能不能把复杂、冗长、需要多步骤的工作,从头到尾做完、做对、做到能直接交付。

ClaudeOpus4.7,就是Anthropic对这个趋势给出的最明确答案。

官方把这次升级的核心,放在了高级软件工程和长时间任务执行上。直白翻译:以前你不敢完全交给AI的高难度编码、长文档梳理、跨文件项目整合,现在可以放心甩过去。它不仅会严格执行你的每一条指令,还会在输出前自己想办法验证结果对不对,尽量少出低级错误。

这种“靠谱度”的提升,在几组硬核测试里体现得淋漓尽致:

1.代码能力:真的能修Bug了

在衡量真实代码修复能力的SWE-benchMultilingual测试中,Opus4.7拿到80.5%,比上一代4.6的77.8%提升2.7个百分点。更吓人的是专业级的SWE-benchPro,直接从前代53.4%飙升到64.3%,把GPT-5.4(57.7%)和Gemini3.1Pro(54.2%)都甩在了身后。

打开网易新闻 查看精彩图片

这意味着:以前需要你全程盯着、反复调试的代码工作,现在Opus4.7可以自主搞定大部分。前端、后端、多语言项目,它都能更稳地跑完全流程。

2.长上下文:100万Token不跑偏

Opus4.7继续保持1Mtoken的超大上下文窗口,并在长链路稳定性上大幅进化。

OpenAI推出的GraphWalks长上下文基准测试:

Parents1M(找父节点):从71.1%→75.1%(+4%)

BFS1M(广度优先搜索):从41.2%→58.6%(暴涨17.4%)

打开网易新闻 查看精彩图片

另一个模拟长期经营的Vending-Bench2测试:

Opus4.6最终余额:8,018美元

Opus4.7最终余额:10,937美元

同一时间、同一台机器,多赚36%

打开网易新闻 查看精彩图片

这说明:Opus4.7能在几十分钟甚至更久的长任务里,始终记住目标、不跑偏、决策更连贯。对需要处理整本书、整套代码库、全项目材料的人来说,这是质的飞跃。

3.知识工作Elo评分:全面领跑

在覆盖44种职业、9大行业的GDPval-AA知识工作评测中,Opus4.7以1753分位居第一:

比Opus4.6(1619)高134分

比GPT-5.4(1674)高79分

比Gemini3.1Pro(1314)高几百分

一句话总结:在真实职场交付物能力上,Opus4.7现在是公认的地表最强。

二、眼睛“换代”:视觉能力接近满分,看懂所有细节

如果说长任务是Opus4.7的“大脑升级”,那视觉能力就是它最炸裂的“硬件革命”。

官方自己都承认:这一代最大亮点,就是视觉理解能力从约50%直接飙升到接近满分。在专业视觉导航测试中,甚至从54.5%暴涨到98.5%——几乎零失误。

1.分辨率翻3倍:看清0.07%的微小元素

Opus4.7支持长边最高2576像素(约375万像素)的图像输入,是前代Claude模型的3倍以上。

这带来两个质变:

精细截图全能看懂:VSCode、Photoshop、AutoCAD等高分辨率截图里,哪怕目标UI元素只占整张图0.07%,它也能精准定位。

复杂图表不丢信息:密密麻麻的数据报表、多层级流程图、产品原型图、设计稿,以前AI经常漏细节、看错数字;现在Opus4.7可以像素级理解。

在ScreenSpot-Pro屏幕定位测试中:

低分辨率:Opus4.6(57.7%)→Opus4.7(69.0%,+11.3%)

高分辨率:Opus4.7直接冲到79%+

打开网易新闻 查看精彩图片

2.视觉+推理:真正的“多模态干活”

视觉能力的爆发,不是孤立的。它和代码、文档、设计能力深度绑定:

给一张UI设计图+需求,它能直接写出对应前端代码

给一页数据截图+分析要求,它能自动提取数字、生成图表、写结论

给一份PPT草稿+排版规范,它能直接优化成专业级演示文稿

Anthropic明确点出:界面设计、幻灯片、文档排版等专业场景,Opus4.7现在更有审美、更有创造力、输出更接近成品。

对分析师、设计师、产品经理、法务来说:以后扔一张截图、一份扫描件、一张草图,AI就能直接出可交付成果——这在以前,想都不敢想。

三、更省心、更连贯:跨会话记忆,少重复、少返工

除了“看得清、做得久”,Opus4.7还在记忆与连贯性上做了关键优化。

1.文件系统记忆:跨会话不忘事

它优化了基于文件系统的记忆机制:

你在多轮对话、甚至多天的多个会话里交代的背景、要求、偏好

Opus4.7会主动记住、自动调用,不用你每次都重复一遍

对长期改同一份文档、跟进同一个项目的人:再也不用反复铺垫上下文,AI自动接上进度。

2.指令更听话:严格执行,不自由发挥

前代模型经常“自作主张”,忽略或曲解你的部分指令。Opus4.7则是逐字、严格、精准地执行你写的每一条要求:格式、字数、风格、结构、限制条件……你怎么定,它就怎么做,偏差极小。

这直接带来体验质变:

写需求更高效:不用反复试探、补prompt

改材料更稳定:一次说清,一次成型,返工率大降

团队协作更可靠:输出predictable,可预期、可复用

四、安全与成本:有提升,也有代价

Anthropic这次很实在:没有把Opus4.7包装成“完美无缺的全面跃升”,而是明确说了优势、短板、成本与风险。

1.安全:更稳,但有护栏

Opus4.7是ProjectGlasswing安全框架下第一个公开部署的模型

诚实性、抗提示词注入能力更强

内置自动检测、拦截高风险网络安全请求的护栏

整体安全画像与4.6相近,部分小项略有波动

官方结论:较为可靠且值得信任,但距离理想状态还有空间。

打开网易新闻 查看精彩图片

2.成本:Token涨了,但价格没涨

好消息:Opus4.7定价和4.6、4.5完全一致,没涨价。坏消息:用起来更费Token:

换了新分词器,同样输入→Token增加1.0~1.35倍

高Effort模式下,输出Token也会变多

高分辨率图片,消耗Token更快

对普通用户:影响主要在免费额度消耗速度、响应速度。对API用户、企业、Agent开发者:直接影响成本预算,必须精打细算。

3.唯一短板:搜索能力小幅下降

在Agenticsearch(BrowseComp)测试中:

Opus4.6:83.7%

Opus4.7:79.3%(-4.4%)

被GPT-5.4(89.3%)和Gemini(85.9%)超越。

官方解释:为了长任务、视觉、代码的全面爆发,在搜索上做了取舍。日常用完全够,但如果你的核心需求是高频联网深度搜索,Opus4.7不是最优解。

五、谁最赚?谁要小心?

最先受益的人

开发者:代码审查、bug修复、复杂项目开发更稳、更少监督

分析师/研究员:长文档精读、数据图表提取、多材料整合、报告撰写

法务/风控:合同审查、条款比对、海量文件合规分析(BigLaw测试90.9%)

产品/设计:截图转需求、原型解读、PPT/文档美化、材料整理

所有高频知识工作者:只要你天天写材料、读文件、做演示、整理数据

早期合作方反馈高度一致:复杂工作流更稳、错误恢复更强、文档推理/代码审查/数据分析/长上下文全都明显提升。

需要多留个心眼

Token预算紧张的团队:高分辨率图、长文本、高Effort模式,Token消耗会明显上升

重度依赖联网搜索的场景:Opus4.7搜索能力略降,可考虑搭配其他模型

旧prompt直接迁移:4.7指令遵循更严格,旧prompt可能需要重新调优

六、大模型决战:从“聊天”到“干活”的终局

Opus4.7的发布,彻底点明了行业下一个主战场:长任务执行、精细视觉理解、工具协同、少监督交付。

Anthropic同步上线的XhighEffort、TaskNudgets公测、ClaudeCode里的/ultrareview深度代码审查,全都是围绕这个方向。

以前我们评价AI:“回答得像人、知识渊博、文笔好”。现在和未来,评价标准只有一个:“能不能把一整件复杂工作,从头到尾做完、做对、直接交付”。

Opus4.7证明:大模型真的在从“会聊天的助手”,变成“能扛事的生产力核心”。

对普通人来说,最直观的感受就是:把需求交代清楚,它更容易一次做对;

看图更细、更准;

写出来的东西、做出来的材料,更能直接拿去用,不用大改。

七、AI生产力的临界点,已经跨过

从ClaudeOpus4.6到4.7,不只是版本号加1,而是能力代际的跨越。

它补上了过去AI最大的短板——视觉理解与长链路可靠性,同时把复杂任务完成度、指令遵循、成品交付能力推到了新高度。

如果你是每天和文档、代码、图表、截图打交道的打工人,Opus4.7带来的不是“更好用一点”,而是工作方式的彻底改变:很多以前必须你亲力亲为、反复修改的脏活累活,现在可以真正交给AI,你只负责定方向、审结果。

AI替代人类工作的那道最重要门槛——可靠完成完整复杂任务——Opus4.7可能已经在不知不觉中,跨过去了。

而这,仅仅是开始。