鱼羊 梦瑶 发自 凹非寺
量子位 | 公众号 QbitAI
春节档国产大模型狂卷,谷歌也突然出手,Gemini 3.1 Pro直接深夜放大招!
相较于去年11月才刚刚发布的3 Pro,别看只是「.1」的一小步,升级幅度肉眼可见:
在官方给出的SVG对比展示中,3.1Pro在多模态生成和语义理解上都提升了一个level。
不仅如此,3.1 Pro还能将日常数据转为互动可视化内容,一个航空航天仪表盘也能轻松roll出:
玩起「模拟城市」来,也是地形生成、道路铺设、交通线路,一整套直接成型:
夯,是真夯,这不有网友们手搓体验完真·就只想说一句——其他家模型可以直接over了(doge)
闲话少叙,技术报告、模型卡更多细节,我们直接开扒——
.1一小步,推理能力一大步
此次升级,官方的说法是把上周发布的Gemini 3 Deep Think背后的核心智能给公开了:
在Gemini 3的基础上,3.1 Pro在核心推理能力上更进一步。
在ARC-AGI-2基准测试中,3.1 Pro获得了77.1%的验证分数,在推理表现上达到3 Pro的2倍之多:
此外,3.1 Pro支持1M上下文,知识截止日期为2025年1月,在多模态理解能力、vibe coding、多语言性能和长上下文方面都同步增强。
在Arena的对比评测结果中,3.1 Pro的整体排名分数也比3 Pro高出13分,文本与代码维度的表现进步也相当明显:
在官方给出的多模态效果中,在同一句提示词下,3.1 Pro在动作连贯性和色彩输出上较3.0 Pro有明显提升:
在推理能力上,3.1 Pro相比上一代能应对结构更复杂、步骤更多的提示词需求。
比如下面这个案例:3.1 Pro直接生成了一个3D版“椋鸟群飞”,视觉代码一次到位,还顺手做出了可交互玩法。
用户可以直接通过手势追踪操控鸟群,而且画面还能够根据鸟群运动变化而生成的音乐~
整体上来看,在复杂主题的可视化方面,Gemini 3.1 Pro确有明显的进化。
网友们也在第一时间对官方宣传进行了检验。
比如用3.1 Pro直接生成一个《我的世界》:
再瞧这位网友,用3.1 Pro搓出来了个人网站(别说,感觉比Gemini官网效果还好?):
还有网友脑洞大开,让3.1 Pro开发了一款教育应用,直言模型在模拟光线效果上那叫一个逼真!
一圈体验下来,大家纷纷表示:
- Gemini没有在开玩笑。
目前,Gemini 3.1 Pro已经在Gemini应用和API中上线,Google AI Pro和Ultra用户还可以在NotebookLM中使用这一最新模型。
智能成本还在呈数量级下降
有意思的一点是,此次发布Gemini 3.1 Pro,是谷歌首次采用「.1」这样的小版本号。
具有网友表示:不儿,Gemini 3 Pro不是还在Preview吗,这就出新模型啦?
不得不说,大模型的2026,注定还是要卷到飞起。
另外值得注意的是,谷歌这一小步,还又把大模型向帕累托前沿推了推。
帕累托前沿(Pareto Front),可以简单理解为最小化成本,最大化性能。
定价方面,Gemini 3.1 Pro Preview的输入价格为2美元(<200k tokens)/4美元(>200k tokens),输出价格为4美元(<200k tokens)/18美元(>200k tokens),跟Gemini 3 Pro Preview持平。
从ARC-AGI基准的视角来看,则是每完成一次ARC-AGI-2任务花费0.96美元(约合人民币6.63元)——
相较之下,Gemini 3 Deep Think价格是3.1 Pro的10倍,而两者性能相差仅几个百分点。
有网友认为,这样的推进速度,「完全打破了传统的成本-智能曲线」。
相比于基准榜单上测试成绩的变化,对于高速进化中的大模型应用而言,成本方面的持续压缩更加值得关注。
并且2026,这才刚刚开始呢。
参考链接:
[1]https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/
[2]https://deepmind.google/models/gemini/pro/
热门跟贴