刚刚，Gemini 3.1 Pro 发布！清华姚顺宇站台宣传，Karpathy：应用商店的时代结束了|gemini|karpathy|姚顺宇|应用商店|编程|谷歌

刚在印度 AI 峰会上经历了最尴尬的一幕，Google CEO Sundar Pichai 转头就在今天凌晨官宣了最新模型 Gemini 3.1 Pro。

时机选得，相当精准（doge）。

OpenAI CEO 和 Anthropic CEO 在合影时拒绝握手，而是高举拳头。

虽然距离上周 Gemini 3 Deep Think 的更新没几天，但 3.1 Pro 的定位，Google 说得很清楚——专为那些「一个简单答案远远不够」的任务而设计，是解决复杂问题的基础底座。

按惯例，0.1 的版本号更新通常意味着小修小补，然而，在测试模型解决全新逻辑模式能力的 ARC-AGI-2 基准上，3.1 Pro 拿下 77.1%，是上代 3 Pro（31.1%）的两倍多，同时压过了 Anthropic 的 Opus 4.6（68.8%）和 OpenAI 的 GPT-5.2（52.9%）。

其它方面，科学知识测试 GPQA Diamond 拿了 94.3%，智能体类基准 MCP Atlas 和 BrowseComp 分别拿下 69.2% 和 85.9%。

编程能力方面，竞争性编程基准 LiveCodeBench Pro 的 Elo 评分达到 2887，超过 3 Pro 的 2439 和 GPT-5.2 的 2393。SWE-Bench Verified 上，3.1 Pro 拿了 80.6%，和 Opus 4.6 的 80.8% 基本打平。

当然，3.1 Pro 也不是处处碾压。

多模态基准 MMMU Pro 上，上代 3 Pro 反而略胜（81.0% vs 80.5%）；启用工具支持的 Humanity's Last Exam 里，Opus 4.6 以 53.1% 拿了第一。外界长期批评 Google 工具使用效率不如对手，这次还是没能完全堵上嘴。

第三方知名分析机构 Artificial Analysis 则给出了相当实在的评价。

3.1 Pro 在他们的智能指数里排名第一，比 Opus 4.6 高 4 分；整个测试跑下来总计使用约 5700 万 tokens，完成测试的成本不到 Opus 4.6 的一半。能打又省钱，这个组合还是很香的。

Google DeepMind 首席科学家 Jeff Dean 也转发了一个是用 3.1 Pro 模拟城市规划、设计全新城市的应用，从零生成可交互的规划界面 demo。

Google 官方博客则展示了几个更日常的方向。代码动画方面，3.1 Pro 可以直接根据文字提示生成动态 SVG，因为是纯代码生成而非像素，任意缩放都不失真，文件体积也远小于传统视频。

复杂系统方面，模型直接接入公开遥测数据流，搭出了一个实时追踪国际空间站轨道的航天仪表盘。

更有意思的是两个创意类 demo。

一个是 3D 椋鸟群模拟，不只是生成视觉代码，还支持用手势操控鸟群，并配有随鸟群动态变化的生成音乐；

另一个是把《呼啸山庄》的文学氛围转化成一个现代个人网站，模型没有简单概括情节，而是分析了小说的整体基调，设计出了贴合主人公气质的界面风格。

此外，网友们也贡献了不少精彩的案例。有人让 3.1 Pro 生成一个「鬼怪猎人穿越鬼屋」的动态 SVG 循环动画，结果直接看呆，评价是「Google 这次是认真的」。

还有网友认为让它生成种子破土、根系延伸、茎秆冒出、叶片展开、直到长成完整大树的交互动画，每个生长阶段的过渡都顺滑自然，说这是见过最好的同类效果。

去年从 Anthropic 转投 Google DeepMind 的清华物理系特奖得主姚顺宇也站台宣传：「Gemini 不仅是一个优秀的模型，而且更好的模型正以不可阻挡的方式到来。」

当然，这些 demo 加在一起说的是同一件事：模型能做的事，已经从单纯的回答问题延伸到完成一整套专业或创意工作流了。

价格方面，API 按分级付费，整体和上代 3 Pro 保持一致，但跟 Anthropic Opus 系列比还是相对便宜的。

20 万 tokens 以内，输入 2 美元 / 每百万 tokens，输出 12 美元；超过 20 万 tokens，输入涨到 4 美元，输出 18 美元。搜索功能每月前 5000 次免费，之后每 1000 次查询收费 14 美元。

现在，开发者可以在 AI Studio、Gemini API、Gemini CLI、智能体开发平台 Google Antigravity 以及 Android Studio；企业用户在 Vertex AI 和 Gemini Enterprise；普通用户在 Gemini 应用和 NotebookLM 都能用，后者仅限 Pro 和 Ultra 订阅。

值得注意的是，3.1 Pro 目前只是预览版，Google 大概率是要继续打磨好智能体工作流再推正式版，向外界展示出一副还没使全力的姿态。

至于这种能力渗透到个人层面会发生什么，这让我联想到了 OpenAI 联创 Andrej Karpathy 刚刚发布的推文：

他想用 8 周时间把静息心率从 50 降到 45，计划是设定 Zone 2 有氧总时长目标，配合每周一次 HIIT。为了追踪进展，他花了 1 小时用 vibe coding 做了一个专属仪表盘。