周三凌晨,Google突然扔出一颗深水炸弹。Gemini 3.5系列正式发布,而且一反常态——先推Flash轻量版,Pro旗舰版反而要再等一个月。这个节奏,和去年3.0系列"Pro先行、Flash跟进"的打法完全相反。
更耐人寻味的是命名。跳过3.2、3.3、3.4,直接从3.1跳到3.5,Google显然想传递某种"代际跨越"的信号。但具体跨越了什么?官方给出的关键词是:frontier intelligence with action——前沿智能,加上行动力。
Flash版:小身材,大野心
3.5 Flash已经上线,面向全球数十亿用户开放。普通用户可以在Gemini App和Google搜索的AI Mode里直接体验;开发者能通过Google Antigravity平台、Gemini API、Google AI Studio和Android Studio接入;企业客户则可以在Gemini Enterprise Agent Platform和Gemini Enterprise里部署。
性能数据方面,Google亮出了几张成绩单。在Terminal-Bench 2.1编码基准测试中得分76.2%,GDPval-AA测试达到1656 Elo,MCP Atlas拿到83.6%,多模态理解的CharXiv Reasoning测试为84.2%。这些数字全部超过了自家的3.1 Pro。
速度是另一张王牌。输出token速度达到同类前沿模型的4倍,在Artificial Analysis指数里落在右上象限——也就是"高质量+低延迟"的甜点区。Google的潜台词很明确:以前选模型要在质量和速度之间二选一,现在不用了。
Agentic:从聊天到干活
3.5 Flash的真正卖点藏在应用场景里。Google反复强调一个词:agentic,具备行动力的。不是陪你聊天,而是真能干活。
官方举了几个例子。配合Antigravity平台,它可以部署协作子代理,自动完成多步骤工作流——比如根据动态标准批量重命名和分类非结构化资产。更夸张的案例是:两个代理协作,六小时内消化完AlphaZero论文并写出可运行的完整游戏;或者把一团乱麻的老旧代码库迁移到Next.js;甚至用建造者+玩家的双代理循环,快速迭代开发游戏。
成本也是一张牌。Google声称,以前开发者干几天、审计师忙几周的活,现在用3.5 Flash能在更短时间内完成,成本还不到其他前沿模型的一半。
Pro版:还在"内部打磨"
至于3.5 Pro,Google只给了一句话:已经在内部使用,下个月推出。没有性能数据,没有应用场景,没有提前放给开发者测试。这种"犹抱琵琶"的姿态,和Flash版的高调形成鲜明对比。
一个可能的解释是:Pro版的定位不再是"更大更强",而是某种Google还没准备好公开的新形态。毕竟3.5 Flash已经在多项基准上超过了3.1 Pro,如果Pro版只是规模放大,故事就太无聊了。
Antigravity:被低估的变量
所有演示都围绕Antigravity展开,这个平台的名字本身就很有意思——反重力,暗示突破常规约束。从官方描述看,它不只是模型API的包装,而是一个"agent-first"的开发环境,支持子代理编排、多步骤工作流监督、动态任务分解。
换句话说,Google在赌:下一代AI竞赛的胜负手,不是单点模型能力,而是谁能先把"模型+工程框架+部署环境"打包成可用的生产工具。OpenAI有ChatGPT和Operator,Anthropic有Computer Use,Google押的是Antigravity+Gemini的组合拳。
3.5 Flash已经摆上桌了。下个月Pro版揭晓时,我们才能判断这场赌局的开局成色。
热门跟贴