★ 设为星标 | 只讲人话,带你玩转AIGC。

太卷了,真的太卷了。

Google 的 Gemini 3 Pro 才发布不到一周吧?

“最强模型”的屁股还没坐热,今早一睁眼,Anthropic 反手就是一个王炸:Claude Opus 4.5 来了。

这就是神仙打架,凡人看戏。

打开网易新闻 查看精彩图片

图:美国 AI 竞争循环

本来Gemini 3 Pro 的编码能力就不如 Claude,这回更是被甩了一条街。

打开网易新闻 查看精彩图片

图:Opus 4.5 性能指标

废话不说,看看它到底强在哪。

1. 代码能力封神:这回是真“大佬”

这次最吓人的还是写代码

在权威的软件工程测试 SWE-Bench 里,它拿了 80.9%,直接甩飞友商。

打开网易新闻 查看精彩图片

图:软件工程能力对比

更离谱的是,Anthropic 透露:在内部高难度招聘测试里,它的得分超过了所有人类候选人。

不过这里有个细节。

这个“超越全人类”的成绩是开了个“外挂”跑出来的——同时试好几种解法挑最好的。

如果关掉外挂,它的成绩是追平了最强人类。

但哪怕是“追平”,也够恐怖了,程序员这回真的。。。得想想新的职业了?

2. 价格膝盖斩:顶级大脑“白菜价”

通常来说,性能越强越贵,但这次 Claude 居然反向操作。

Opus 4.5 的价格,直接比上一代砍掉了三分之二。

打开网易新闻 查看精彩图片

图:Claude 模型价格对比

立刻能用的神器

除了这些,他们还提供了一些工具,我们可以直接用起来:

- Claude for Chrome: 浏览器装个大脑,跨标签页自动整理信息,搬砖神器。

- Claude for Excel: 别背公式了,直接跟它说人话,表格自动搞定。

Claude 写代码最强其实早就不算新闻了,但这周的剧情真的太精彩。

前两天 Gemini 3 Pro 刚发布时,那种“手搓代码”的演示已经让无数人直呼“天花板”了。

结果呢?Anthropic 连一周的安全期都没给对手留,反手就用 Opus 4.5 再次刷新了认知。

巨头们卷得越凶,留给我们的工具就越强。

评论区聊聊,在这个“代码大爆炸”的时代,你最看好谁?