这才是神仙打架！Gemini 3 Pro 手搓代码刚封神，Opus 4.5 就杀回来了。

AI范儿

2025-11-25 07:43 ·上海 ·优质互联网领域创作者

★ 设为星标 | 只讲人话，带你玩转AIGC。

太卷了，真的太卷了。

Google 的 Gemini 3 Pro 才发布不到一周吧？

“最强模型”的屁股还没坐热，今早一睁眼，Anthropic 反手就是一个王炸：Claude Opus 4.5 来了。

这就是神仙打架，凡人看戏。

图：美国 AI 竞争循环

本来Gemini 3 Pro 的编码能力就不如 Claude，这回更是被甩了一条街。

图：Opus 4.5 性能指标

废话不说，看看它到底强在哪。

1. 代码能力封神：这回是真“大佬”

这次最吓人的还是写代码。

在权威的软件工程测试 SWE-Bench 里，它拿了 80.9%，直接甩飞友商。

图：软件工程能力对比

更离谱的是，Anthropic 透露：在内部高难度招聘测试里，它的得分超过了所有人类候选人。

不过这里有个细节。

这个“超越全人类”的成绩是开了个“外挂”跑出来的——同时试好几种解法挑最好的。

如果关掉外挂，它的成绩是追平了最强人类。

但哪怕是“追平”，也够恐怖了，程序员这回真的。。。得想想新的职业了？

2. 价格膝盖斩：顶级大脑“白菜价”

通常来说，性能越强越贵，但这次 Claude 居然反向操作。

Opus 4.5 的价格，直接比上一代砍掉了三分之二。

图：Claude 模型价格对比

立刻能用的神器

除了这些，他们还提供了一些工具，我们可以直接用起来：

- Claude for Chrome：浏览器装个大脑，跨标签页自动整理信息，搬砖神器。

- Claude for Excel：别背公式了，直接跟它说人话，表格自动搞定。

Claude 写代码最强其实早就不算新闻了，但这周的剧情真的太精彩。

前两天 Gemini 3 Pro 刚发布时，那种“手搓代码”的演示已经让无数人直呼“天花板”了。

结果呢？Anthropic 连一周的安全期都没给对手留，反手就用 Opus 4.5 再次刷新了认知。

巨头们卷得越凶，留给我们的工具就越强。

评论区聊聊，在这个“代码大爆炸”的时代，你最看好谁？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴