谷歌壕掷1800亿美元

商业模式桑博士

2026-05-03 18:32 ·北京 ·优质财经领域创作者

作者 | 万连山

数据支持 | 勾股大数据（www.gogudata.com）

谷歌正在押下史上规模最大的赌注之一：计划今年投入1750亿-1850亿美元搞基建。

其中，60%用于刚刚在拉斯维加斯举办的Google Cloud Next大会上亮相的第八代TPU，史无前例地拆分成了两款：专攻模型训练的TPU 8t，专攻推理的TPU 8i。

40%用于搭建支持智能体运行的数据中心和网络架构。

这一切，都是为了迎接即将到来的“智能体时代”。

01

“前智能体时代”的交互模式是，用户写一堆复杂的提示词，AI生成内容。

然后呢？

具体用这些内容做什么、怎么用，都由用户自己执行。

AI只负责动嘴，真正干活的还是人。

人→AI→人，这是三个环节。

进入智能体时代后，AI就不再是单纯的被动应答聊天工具，而是具备了感知、推理、调用工具并采取行动的实用工具。

简单来说，它拥有执行能力，乃至执行权。

环节只剩人→AI，极大提升了生产效率。

两者本质上是“被动工具”与“主动生产力”的区别。

所以，为什么要斥巨资研发这玩意？

因为智能体是目前唯一能带来非线性人效提升的方案。

前沿模型智能体目前能以80%的可靠性自主完成的任务长度，来源：METR

仅看本次展示的其中几个行业：

1.金融。

高盛CTO分享了基于Gemini Enterprise和TPU 8i算力集群打造的内部智能体“GS-Alpha”。

它每天实时监控全球45000个新闻源、1200场上市公司的财报电话会议（直接听音频，文本转录有延迟）。

一旦某家公司CEO在电话会里的语气出现异常的停顿或犹豫（语音情感分析），GS-Alpha会在0.2秒内完成多步逻辑推理，自动生成一份风险预警报告，并直接通过API向交易系统下达对冲指令。

据高盛披露的数据，这套系统上线后，其投研部门的数据处理通量提升了1400%，研报的平均生成时间从48小时压缩到了3分钟。

2.医疗。

梅奥诊所展示了最新的“Med-Agent”工作流。

当一个疑难杂症患者入院时，Med-Agent会自动调取患者过去15年的电子病历，同时调用医学影像分析模型，结合最新的医学期刊数据库自动拉起一个“专家智能体会诊”。

内科智能体、外科智能体、病理科智能体在系统内进行相互辩论，最终给提供三个带有明确置信度和文献引用的治疗方案。

根据《柳叶刀》2月针对40家大型医院的研究数据，采用Med-Agent辅助的科室，误诊率降低了31%，医生每天花在“写病历和查资料”上的行政时间减少了65%。

3.跨境电商。

欧美知名家居电商Wayfair通过接入Vertex AI，打造了一个庞大的数字孪生供应链智能体。

它连接了全球3000多个供应商、80个海运港口和150个仓储中心的实时API。

比如在1月底，智能体通过抓取当地新闻和社交媒体情感分析，第一时间检测到孟加拉国即将发生大规模罢工。

为了避免全棉床单断货，它不需要等待企业人工审批……直接向越南的备用工厂发送了紧急加单邮件；并自动调用马士基的物流API，修改三个集装箱的航线；同时自动登录亚马逊和自家官网后台，将现有全棉床单的售价上调12%，以平滑库存消耗。

根据Deloitte发布的《全球供应链数字化转型报告》，全面采用这类自主智能体的零售企业，其库存周转率平均提升了45%，因供应链断裂导致的缺货损失降低了73%。。

显然，对企业而言，智能体不止是“降本增效”这么简单，更能解决曾经无解的痛点。

它能做到人做不到的事。

根据Gartner在3月最新发布的《企业级AI智能体落地与ROI追踪白皮书》：

截至2026年第一季度，全球500强企业中，已有82%在核心业务流程中部署了至少一个具备“自主执行能力”的智能体，而这个数字在2024年底仅为11%；部署基于多智能体系统的企业，平均投资回报期从2025年的14个月，断崖式下降到4.5个月。

截至2025年末，谷歌专门针对企业客户的Gemini Enterprise，仅仅推出几个月，就卖出了超过800万个付费席位。

2026年Q1，其Gemini API的日均调用量达到了1200亿次。其中，包含“工具调用”和“多步推理”的复杂智能体请求占比，从去年的不到15%飙升至68%。

这方面的需求，是毋庸置疑的，而且其爆发期才刚刚开始。

但是，困境也很明显。

IDC预测2031年中国将存在3.5亿个活跃智能体，来源：开源证券

02

智能体系统引入了多步推理、外部API工具调用、记忆机制。

要支撑大量智能体同时并发工作、且不能有明显的延迟卡顿，企业内部系统的API请求量必然呈指数级爆发。

Gartner的报告指出，2025年有40%的企业级AI项目失败，并不是因为模型不够聪明，而是因为“算力塞车”导致智能体超时崩溃。

如果没有底层硬件的突破，智能体的大规模落地根本就是空中楼阁。

谷歌的底层算力架构必须要升级。

首先是硬件方面。

第八代TPU被史无前例地拆分成了两款截然不同的芯片：专攻模型训练的TPU 8t，专攻推理的TPU 8i。

前者还是经典的大力出奇迹产品，采用了“双计算芯粒 + 单I/O芯粒”的设计，单个超级计算节点可以集成9600块芯片，计算性能达到121 Exaflops（百亿亿次浮点运算）。相比去年发布的第七代，同等价格下的性能提升了2.8倍，每瓦性能提升了124%。

后者的作用，则是应付海量智能体并发时的极端低延迟要求。

在AI推理中，算力往往不是瓶颈，把数据从内存搬到处理器的过程才是最耗时、最耗能源的，俗称内存墙。

为了突破这堵墙，TPU 8i上内置了高达384MB的SRAM，容量是上一代的三倍，同时还外挂了288GB的HBM显存。

这意味着模型在运行时的活跃工作集可以完全塞进芯片内部，几乎不需要去外部要数据，处理器空闲等待时间锐减。

其次是软件生态。

这次Next大会上，谷歌推出了统一的AI技术堆栈，升级了Vertex AI平台，甚至抛出了Google Antigravity平台这个大杀器。

Antigravity是一个专门为开发者打造的构建自主智能体的全栈工具链。

以前开发一个Agent，开发者需要自己写代码去接各种API、设计长短期记忆库、规划执行逻辑。

现在，谷歌把这些全打包成了基础设施，开发者可以像搭乐高一样，轻松构建具备任务规划、工具调用能力的AI应用。

不过，这也引发了一个问题。

还是对SaaS行业的担忧。

SaaS基本面恶化，来源：浙商证券

如果AI Agent能自己拉数据、写报表、发邮件，那企业干嘛还要给员工买Salesforce、Workday或者Excel的订阅席位？

没有了这些，SaaS公司还有什么存在的必要？

皮查伊抛出了一个数据安抚市场：“头部95%的SaaS公司，已经在采用Gemini来重构业务。”

未来的SaaS公司将不再单纯出售软件系统，而是将其转化为底层的数据API，直接卖给谷歌或客户的AI智能体。

这就催生了一个庞大的新兴业务：数据现代化改造。

智能体再怎么聪明，首先它得有数据。

企业买单的前提是，智能体能读取企业内部的私有数据。但很多大型企业的ERP、CRM系统老旧不堪，根本就没有标准的API接口。

也就是说，谷歌不仅在卖智能体服务，还在利用这波机会，强迫企业把所有底层数据全部搬到Google Cloud的BigQuery数据库里。

据预测，每在AI上花费1美元，将带动至少3美元的底层数据清洗和云存储需求。

这是真正的“连环收割”盈利路线。

03

当TPU 8t在日以继夜地训练更聪明的大脑，当TPU 8i在数据中心里以光速处理海量的推理请求时，世界的规则已经被悄然改写。

随着智能体大量投入应用，AI再也不是为人赋能的工具，而是真正成为可以替代人的执行者。

在这种情况下，绝大部分企业其实没有选择。

你不用，你的对手用怎么办？

最原始的生存法则一定会使得智能体在企业端的需求得到完全释放。

最终，必然会造成两个显而易见的后果。

首先，市场格局进一步两极分化。

智能体的研发和部署，都需要海量的资金、技术和人才，少数巨头通过加大投入掌控智能体的核心技术和基础设施，将进一步扩大自己的优势；而中小企业，只能在前者构建的生态中，从事一些细分领域的工作，很难再形成竞争力。

其次，谁来买单？

不难想象，随着智能体深度应用，每一个消费者都能得到极致的专属智能服务，享受更舒适便捷的生活。

但是，为这些服务买单的财富，从哪里来？（全文完）

格隆汇声明：文中观点均来自原作者，不代表格隆汇观点及立场。特别提醒，投资决策需建立在独立思考之上，本文内容仅供参考，不作为任何实际操作建议，交易风险自担。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴