谷歌突发Gemini 3.1 Pro！首次采用「.1」版本号，推理性能×2

量子位

2026-02-20 09:24 ·河北 ·《量子位》官方网易号

鱼羊梦瑶发自凹非寺
量子位 | 公众号 QbitAI

春节档国产大模型狂卷，谷歌也突然出手，Gemini 3.1 Pro直接深夜放大招！

相较于去年11月才刚刚发布的3 Pro，别看只是「.1」的一小步，升级幅度肉眼可见：

在官方给出的SVG对比展示中，3.1Pro在多模态生成和语义理解上都提升了一个level。

不仅如此，3.1 Pro还能将日常数据转为互动可视化内容，一个航空航天仪表盘也能轻松roll出：

玩起「模拟城市」来，也是地形生成、道路铺设、交通线路，一整套直接成型：

夯，是真夯，这不有网友们手搓体验完真·就只想说一句——其他家模型可以直接over了（doge）

闲话少叙，技术报告、模型卡更多细节，我们直接开扒——

.1一小步，推理能力一大步

此次升级，官方的说法是把上周发布的Gemini 3 Deep Think背后的核心智能给公开了：

在Gemini 3的基础上，3.1 Pro在核心推理能力上更进一步。

在ARC-AGI-2基准测试中，3.1 Pro获得了77.1%的验证分数，在推理表现上达到3 Pro的2倍之多：

此外，3.1 Pro支持1M上下文，知识截止日期为2025年1月，在多模态理解能力、vibe coding、多语言性能和长上下文方面都同步增强。

在Arena的对比评测结果中，3.1 Pro的整体排名分数也比3 Pro高出13分，文本与代码维度的表现进步也相当明显：

在官方给出的多模态效果中，在同一句提示词下，3.1 Pro在动作连贯性和色彩输出上较3.0 Pro有明显提升：

在推理能力上，3.1 Pro相比上一代能应对结构更复杂、步骤更多的提示词需求。

比如下面这个案例：3.1 Pro直接生成了一个3D版“椋鸟群飞”，视觉代码一次到位，还顺手做出了可交互玩法。

用户可以直接通过手势追踪操控鸟群，而且画面还能够根据鸟群运动变化而生成的音乐~

整体上来看，在复杂主题的可视化方面，Gemini 3.1 Pro确有明显的进化。

网友们也在第一时间对官方宣传进行了检验。

比如用3.1 Pro直接生成一个《我的世界》：

再瞧这位网友，用3.1 Pro搓出来了个人网站（别说，感觉比Gemini官网效果还好？）：

还有网友脑洞大开，让3.1 Pro开发了一款教育应用，直言模型在模拟光线效果上那叫一个逼真！

一圈体验下来，大家纷纷表示：

Gemini没有在开玩笑。

目前，Gemini 3.1 Pro已经在Gemini应用和API中上线，Google AI Pro和Ultra用户还可以在NotebookLM中使用这一最新模型。

智能成本还在呈数量级下降

有意思的一点是，此次发布Gemini 3.1 Pro，是谷歌首次采用「.1」这样的小版本号。

具有网友表示：不儿，Gemini 3 Pro不是还在Preview吗，这就出新模型啦？

不得不说，大模型的2026，注定还是要卷到飞起。

另外值得注意的是，谷歌这一小步，还又把大模型向帕累托前沿推了推。

帕累托前沿（Pareto Front），可以简单理解为最小化成本，最大化性能。

定价方面，Gemini 3.1 Pro Preview的输入价格为2美元（＜200k tokens）/4美元（>200k tokens），输出价格为4美元（＜200k tokens）/18美元（>200k tokens），跟Gemini 3 Pro Preview持平。

从ARC-AGI基准的视角来看，则是每完成一次ARC-AGI-2任务花费0.96美元（约合人民币6.63元）——

相较之下，Gemini 3 Deep Think价格是3.1 Pro的10倍，而两者性能相差仅几个百分点。

有网友认为，这样的推进速度，「完全打破了传统的成本-智能曲线」。

相比于基准榜单上测试成绩的变化，对于高速进化中的大模型应用而言，成本方面的持续压缩更加值得关注。

并且2026，这才刚刚开始呢。

参考链接：
[1]https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/
[2]https://deepmind.google/models/gemini/pro/

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴