“不再有「One More Thing」,巨头选择直接把模型推到用户面前。”
作者丨陈淑瑜 陈嘉欣
编辑丨岑峰 林觉民
Google I/O 向来是全球开发者日历上最密集的信息节点,更是科技巨头宣示AI野心的最高舞台。
2026年5月19日,加州山景城,Sundar Pichai 在两个小时内扔了16款核心产品更新。其中有5个产品各自坐拥30亿用户,Gemini 助手已有9亿用户,搜索AI Mode上线仅一年,月活突破10亿。
没有"One More Thing"的悬念节奏,没有刻意留到最后的重磅彩蛋。Google选择了一种近乎轰炸式的信息发布策略:把所有东西一次性摊在桌面上。
Pichai在台上说了一句耐人寻味的话:"最前沿的Agent可能只触达过世界上0.1%的人。真正的问题,是怎么把这种前沿能力规模化交付给真正的更广泛的用户。"
这话的潜台词很直白:Agent 今天还是少数极客和高端企业的玩具,但 Google 要把它变成30亿人的日常。
Google I/O 2026的发布清单(部分)
详情链接:https://blog.google/innovation-and-ai/technology/developers-tools/google-io-2026-collection/
01
饱和攻击:Google如何封死所有入口
如果把Google这次发布的产品叠起来看,可以读出四层清晰的结构。
模型层是最底层。
Gemini 3.5 Flash承担的是"压低Agent边际成本"的任务。它的输出速度是同级别前沿模型的4倍,价格却不到一半。
Pichai在台上算了一笔账:一家头部企业如果一天处理一万亿token,把80%的负载从其他前沿模型迁到3.5 Flash,一年能省下超过10亿美元。
产品层是用户直接感知的部分。
此次产品层最大的变化是Gemini 从“一个 AI 应用/助手”变成跨搜索、办公、邮箱、视频、开发、图像、硬件和 Android 系统的通用代理层。
比如Search Generative UI、Ask YouTube等产品说明搜索已经可以直接理解内容、定位片段、生成答案和交互布局。
这意味着 Google 最核心的搜索产品,正在从“信息检索”走向“答案与任务界面”。
Gemini Spark、Daily Brief、Information Agents、Android Halo 都是做持续运行的个人代理,说明 AI 不再只是被动响应,而是开始常驻、主动、跨应用工作。
尤其是Intelligent Eyewear等硬件方面的新品,本质上是在抢“下一代默认交互界面”。
商业层解决的是"Agent怎么赚钱"的问题。
Universal Cart是跨平台购物车,带兼容性检查和价格追踪。Compute-Used计费取代了每日限额,新增的100美元/月Ultra档位和降至200美元/月的原档位,构成了更精细的定价梯度。
基础设施层是支撑一切的底座。
Google 内部日处理token已经从3月的5000亿激增至如今的3万亿以上,每月跨自家产品处理的token已达3.2千万亿,是2025年I/O时480万亿的7倍。全球部署超过100万颗第八代TPU,首次走"双芯片"分工路线。8T专做训练,8I专做推理,构成了竞争对手难以复制的护城河。
"25年来最大的搜索升级"。
这些产品更新中,最重要的在于搜索AI Mode,被Google称为"25年来最大的搜索升级"。
传统搜索是"用户输入关键词,搜索引擎返回链接列表"。而AI Mode是"用户用自然语言描述需求,搜索引擎直接生成答案、执行操作、甚至代用户完成任务"。
Generative UI让搜索框根据查询内容动态生成不同的界面布局。查天气时自动生成带图表的dashboard,查股票时自动生成走势图,查餐厅时自动生成地图和评分卡片。
Custom Dashboards(Mini Apps)让用户可以创建持久化的自定义追踪面板。比如追踪某个股票的实时数据、某个航班的动态、某个电商商品的价格变化。这些面板超越了静态网页的范畴,完全由AI动态生成交互式界面。
Information Agents则更进一步。它们超越了"用户查询时才响应"的传统模式,转向7x24小时后台监控。当某个用户关心的信息发生变化时,Agent主动推送通知。
这意味着搜索框正在从"检索工具"变成"AI工作面"(Runtime)。搜索框变成了一种常驻的背景能力,随时待命。
Gradient Flow创始人Ben Lorica在会后写了一篇分析,核心判断是:"Google used this I/O to stake a claim on the agentic layer, and the ambition is wider than any single product."
他的观察是:Google的方向很明确,要让AI从"回答问题"升级为"运行界面、工作流和代理,覆盖整个生态系统"。
从模型层到产品层到商业层到基础设施层,每一层都在为同一个目标服务:让Agentic AI成为Google生态的默认运行模式。
9to5Google对此的报道很直接:"At I/O 2026, Google announced a tidal wave of new Gemini-powered features across its biggest products and services."
"Tidal wave"这个词选得准确,Google没有给竞争对手留下任何可以喘息的缝隙。搜索、浏览器、手机、眼镜、办公套件、开发者工具、购物、科研,全部被Agent覆盖。
但Google再一次的饱和式发布不是炫耀,是焦虑。
在Agent赛道上"虽迟但到"的Google,正在用生态广度弥补单点创新的不足。
Gradient Flow的Ben Lorica说得更直接:Google用这场I/O宣示了对Agentic层的主权,其野心远超任何单一产品。
02
阻击OpenAI:模型竞赛的另一条战线
Gemini 3.5 Flash是发布会当天全面可用的产品,也是Google阻击OpenAI的核心武器。
这是谷歌最强的Agent和编程轻量模型,能部署多个子Agent协同完成任务,在几乎所有基准测试上超过上一代旗舰Gemini 3.1 Pro。
输出速度是其他前沿模型的4倍,在Antigravity中优化后可达12倍。价格不到同档前沿模型的一半。这种速度与性能的平衡使3.5 Flash成为处理长时程Agent任务的最理想选择。
由此可见,Google选择的竞争维度已经超出了"谁的模型更聪明",转向"谁的模型更便宜、更快、更容易规模化部署"。
速度只是表象。真正的杀招在生态位。
OpenAI目前是一个"有大脑、没身体"的巨人。GPT-5.5在基准测试上依然领先,但用户需要通过API把它接入别人的产品里。
而Google展现的则是"全地形作战"能力:用户不需要打开ChatGPT、不需要切换应用,就在Workspace、手机系统、搜索框里完成所有任务。
Workspace的集成是原生的。Gmail里语音编辑,Docs里语音"头脑风暴"创建文档,Keep里语音操作。Microsoft 365也能接OpenAI的API,但那是嫁接,这是内置。
更狠的是定价策略。Google Search免费使用3.5 Flash。OpenAI的同等能力需要付费。
Pichai算了一笔账给CIO听:一家头部企业一天处理一万亿token,把80%的负载从其它前沿模型迁到3.5 Flash,一年能省下超过10亿美元。
他还透露了一个极限测试:在尚未发布的3.5 Pro支持下,Google曾让93个不同Agents协同工作,消耗26亿token,从零建造起一个复杂系统项目。
这充分展示了Agent编排的规模化能力。
OpenAI当然不会坐以待毙。Codex已经上线移动端,Operator在做Agent探索。但Google这一轮饱和攻击的底层逻辑很清楚:AI竞赛从"谁拥有最好的模型"转向"谁拥有运行智能体的完整堆栈"。
事实说明,OpenAI可能在某些基准测试上领先,但Google在"把模型推到用户面前"这件事上拥有结构性优势。
03
围剿Anthropic:编程赛道的官方化战争
Antigravity 2.0是这场I/O中最被低估的发布。
它从"面向开发者的智能体式IDE"转向"通用多Agent编排平台",作为独立桌面应用成为Agent交互的中央枢纽。任何人都能编排Agent完成各类任务,不限于编码。它可以同时部署多个Agent,一个写代码、一个生成素材、一个规划架构。
最关键是Antigravity SDK,它让第三方程序可直接、可编程地访问驱动Google自家产品的同一套Agent harness。
这是在构建Agent时代的"Android"。
Google内部测试显示,Agent完全从零搭出一个能跑的操作系统,API耗费在1000美金以内。
但开发者社区的反馈并不一边倒。Gradient Flow的调研显示,部分开发者认为Google的编码体验"sloppy",尤其在深层系统级工作中表现不佳。Gemini在Agent编码和工具使用方面仍落后于OpenAI和Anthropic。
这恰恰说明了两种生态哲学的碰撞。Anthropic的Claude Code走的是"精英路线",SWE-Bench Pro 64.3%当前公开基准领先,强调安全、可靠、高质量。
Anthropic收购Stainless,买的是"顶级人工把关最后防线"。Google的Antigravity走的是"官方化"路线,用基础设施规模加多Agent编排加极速性能,把编程Agent变成Google生态的默认选项。
前者是"少而精",后者是"大而全"。
Cursor年收入突破20亿美金,证明了编程Agent市场的巨大空间。Google现在带着3.5 Flash的1000美元搭系统成本杀入,对整个独立开发者工具赛道都是一次降维打击。
部分开发者看好Google的集成优势,尤其是与Android、Firebase、Google AI Studio的原生打通,这是OpenAI和Anthropic所不具备的。
但从业者会根据其在真实代码库中的可靠性来评判。编排故事很有前景,但粗糙的编码体验能不能撑起企业级应用,还需要时间验证。
04
Gemini for Science:
把AI从"回答问题"升级为"做科学研究"
在整场发布会中最具长期战略意义、也最耐人寻味的,莫过于Gemini for Science的低调亮相。
这一布局,完美印证了我们之前对大模型演进范式的判断。
快思考是Thinking Machine Lab的等一批OpenAI叛将的路径。Altman强调了当前大模型在瞬时响应上的极限,表示快不一定代表好,现在Google则是在此基础上,实现超级加倍。
Gemini for Science的定位很明确:"人类创造力的倍增器"。不止于问答,覆盖假设生成、计算验证、文献综合的完整科学方法闭环。
Gemini for Science的三大实验性原型工具已在Google Labs推出。
Co-Scientist通过多智能体"创意竞赛"生成、辩论并评估假设,所有主张均经过深度验证并附可点击引用。
AlphaEvolve并行生成并评分数千种代码变体,BASF用它优化供应链,Klarna用它将训练速度翻倍。
NotebookLM检索科学文献,将结果结构化为可自定义属性的表格,支持聊天式深挖并生成报告、幻灯片、信息图及音视频概述。
Science Skills直接集成于Antigravity等平台,整合超过30个主要生命科学数据库和工具,将结构生物信息学和基因组分析从数小时缩短至数分钟。
这背后是DeepMind二十年的科学AI积累。Co-Scientist来自DeepMind,AlphaEvolve来自DeepMind,直接集成AlphaFold Database和AlphaGenome API。AlphaFold已帮助超过300万研究人员。
相比于 OpenAI 还在探索如何让模型“显得有逻辑”,拥有 DeepMind 血统的 Gemini for Science 显然更值得大众和整个科学界期待,它代表着 AI 真正进入改造客观世界的深水区。
05
Agent时代的胜负手
Google I/O 2026 是一面镜子,照出了大模型战争下半场最残酷的演进规律:Agent 时代的胜负手,在于谁能先终结延迟和模态切换。
在过去两年里,AI 创业圈享受了一段黄金般的“小确幸”时代。无数独立开发者和独角兽公司的成功模式,本质上都是“在 ChatGPT 之外,找一个细分场景,做一个体验好 10 倍的包装 App 或插件”。
但 Google 这场饱和式发布,用近乎粗暴的方式传递了一个信号:用“原生一体化”消解 OpenAI 辛苦建立的“插件生态”和创业者的生存空间。
当用户不需要在窗口间切换上下文,不需要跨生态忍受网络延迟,就能在系统底层和日常工具里调用一切 Agent 能力时,那些“套壳”和“单点创新”的工具溢价空间将被无情压缩。
这标志着 AI 领域的一系列“小确幸”时代彻底结束了,“大帝国”的全面竞争正式开启。
在这场关于“入口所有权”的终极绞杀中,没有公司能偏安一隅。巨头已经携千亿资本筑起高墙,而留给独立开发者的,将是一场必须向着极高精度和绝对中立长尾进军的生死突围。
本文作者长期追踪国内外科技巨头动态、前沿技术和幕后故事,欢迎添加微信 aqingcjx 一起快乐吃瓜。
热门跟贴