作者 | 万连山

数据支持 | 勾股 大数 据(www.gogudata.com)

谷歌正在押下史上规模最大的赌注之一:计划今年投入1750亿-1850亿美元搞基建。

其中,60%用于刚刚在拉斯维加斯举办的Google Cloud Next大会上亮相的第八代TPU,史无前例地拆分成了两款:专攻模型训练的TPU 8t,专攻推理的TPU 8i

40%用于搭建支持智能体运行的数据中心和网络架构。

这一切,都是为了迎接即将到来的“智能体时代”。

打开网易新闻 查看精彩图片

01

“前智能体时代”的交互模式是,用户写一堆复杂的提示词,AI生成内容。

然后呢?

具体用这些内容做什么、怎么用,都由用户自己执行。

AI只负责动嘴,真正干活的还是人。

人→AI→人,这是三个环节。

进入智能体时代后,AI就不再是单纯的被动应答聊天工具,而是具备了感知、推理、调用工具并采取行动的实用工具。

简单来说,它拥有执行能力,乃至执行权。

环节只剩人→AI,极大提升了生产效率。

两者本质上是“被动工具”与“主动生产力”的区别。

所以,为什么要斥巨资研发这玩意?

因为智能体是目前唯一能带来非线性人效提升的方案。

打开网易新闻 查看精彩图片

前沿模型智能体目前能以80%的可靠性自主完成的任务长度,来源:METR

仅看本次展示的其中几个行业:

1.金融。

高盛CTO分享了基于Gemini Enterprise和TPU 8i算力集群打造的内部智能体“GS-Alpha”。

它每天实时监控全球45000个新闻源、1200场上市公司的财报电话会议(直接听音频,文本转录有延迟)。

一旦某家公司CEO在电话会里的语气出现异常的停顿或犹豫(语音情感分析),GS-Alpha会在0.2秒内完成多步逻辑推理,自动生成一份风险预警报告,并直接通过API向交易系统下达对冲指令。

据高盛披露的数据,这套系统上线后,其投研部门的数据处理通量提升了1400%,研报的平均生成时间从48小时压缩到了3分钟。

2.医疗。

梅奥诊所展示了最新的“Med-Agent”工作流。

当一个疑难杂症患者入院时,Med-Agent会自动调取患者过去15年的电子病历,同时调用医学影像分析模型,结合最新的医学期刊数据库自动拉起一个“专家智能体会诊”。

内科智能体、外科智能体、病理科智能体在系统内进行相互辩论,最终给提供三个带有明确置信度和文献引用的治疗方案。

根据《柳叶刀》2月针对40家大型医院的研究数据,采用Med-Agent辅助的科室,误诊率降低了31%,医生每天花在“写病历和查资料”上的行政时间减少了65%。

3.跨境电商。

欧美知名家居电商Wayfair通过接入Vertex AI,打造了一个庞大的数字孪生供应链智能体。

它连接了全球3000多个供应商、80个海运港口和150个仓储中心的实时API。

比如在1月底,智能体通过抓取当地新闻和社交媒体情感分析,第一时间检测到孟加拉国即将发生大规模罢工。

为了避免全棉床单断货,它不需要等待企业人工审批……直接向越南的备用工厂发送了紧急加单邮件;并自动调用马士基的物流API,修改三个集装箱的航线;同时自动登录亚马逊和自家官网后台,将现有全棉床单的售价上调12%,以平滑库存消耗。

根据Deloitte发布的《全球供应链数字化转型报告》,全面采用这类自主智能体的零售企业,其库存周转率平均提升了45%,因供应链断裂导致的缺货损失降低了73%。。

显然,对企业而言,智能体不止是“降本增效”这么简单,更能解决曾经无解的痛点。

它能做到人做不到的事。

根据Gartner在3月最新发布的《企业级AI智能体落地与ROI追踪白皮书》:

截至2026年第一季度,全球500强企业中,已有82%在核心业务流程中部署了至少一个具备“自主执行能力”的智能体,而这个数字在2024年底仅为11%;部署基于多智能体系统的企业,平均投资回报期从2025年的14个月,断崖式下降到4.5个月。

截至2025年末,谷歌专门针对企业客户的Gemini Enterprise,仅仅推出几个月,就卖出了超过800万个付费席位。

2026年Q1,其Gemini API的日均调用量达到了1200亿次。其中,包含“工具调用”和“多步推理”的复杂智能体请求占比,从去年的不到15%飙升至68%。

这方面的需求,是毋庸置疑的,而且其爆发期才刚刚开始。

但是,困境也很明显。

打开网易新闻 查看精彩图片

IDC预测2031年中国将存在3.5亿个活跃智能体,来源:开源证券

02

智能体系统引入了多步推理、外部API工具调用、记忆机制。

要支撑大量智能体同时并发工作、且不能有明显的延迟卡顿,企业内部系统的API请求量必然呈指数级爆发。

Gartner的报告指出,2025年有40%的企业级AI项目失败,并不是因为模型不够聪明,而是因为“算力塞车”导致智能体超时崩溃。

如果没有底层硬件的突破,智能体的大规模落地根本就是空中楼阁。

谷歌的底层算力架构必须要升级。

首先是硬件方面。

第八代TPU被史无前例地拆分成了两款截然不同的芯片:专攻模型训练的TPU 8t,专攻推理的TPU 8i。

前者还是经典的大力出奇迹产品,采用了“双计算芯粒 + 单I/O芯粒”的设计,单个超级计算节点可以集成9600块芯片,计算性能达到121 Exaflops(百亿亿次浮点运算)。相比去年发布的第七代,同等价格下的性能提升了2.8倍,每瓦性能提升了124%。

后者的作用,则是应付海量智能体并发时的极端低延迟要求。

在AI推理中,算力往往不是瓶颈,把数据从内存搬到处理器的过程才是最耗时、最耗能源的,俗称内存墙。

为了突破这堵墙,TPU 8i上内置了高达384MB的SRAM,容量是上一代的三倍,同时还外挂了288GB的HBM显存。

这意味着模型在运行时的活跃工作集可以完全塞进芯片内部,几乎不需要去外部要数据,处理器空闲等待时间锐减。

其次是软件生态。

这次Next大会上,谷歌推出了统一的AI技术堆栈,升级了Vertex AI平台,甚至抛出了Google Antigravity平台这个大杀器。

Antigravity是一个专门为开发者打造的构建自主智能体的全栈工具链。

以前开发一个Agent,开发者需要自己写代码去接各种API、设计长短期记忆库、规划执行逻辑。

现在,谷歌把这些全打包成了基础设施,开发者可以像搭乐高一样,轻松构建具备任务规划、工具调用能力的AI应用。

不过,这也引发了一个问题。

还是对SaaS行业的担忧。

打开网易新闻 查看精彩图片

SaaS基本面恶化,来源:浙商证券

如果AI Agent能自己拉数据、写报表、发邮件,那企业干嘛还要给员工买Salesforce、Workday或者Excel的订阅席位?

没有了这些,SaaS公司还有什么存在的必要?

皮查伊抛出了一个数据安抚市场:“头部95%的SaaS公司,已经在采用Gemini来重构业务。

未来的SaaS公司将不再单纯出售软件系统,而是将其转化为底层的数据API,直接卖给谷歌或客户的AI智能体。

这就催生了一个庞大的新兴业务:数据现代化改造。

智能体再怎么聪明,首先它得有数据。

企业买单的前提是,智能体能读取企业内部的私有数据。但很多大型企业的ERP、CRM系统老旧不堪,根本就没有标准的API接口。

也就是说,谷歌不仅在卖智能体服务,还在利用这波机会,强迫企业把所有底层数据全部搬到Google Cloud的BigQuery数据库里。

据预测,每在AI上花费1美元,将带动至少3美元的底层数据清洗和云存储需求。

这是真正的“连环收割”盈利路线。

03

当TPU 8t在日以继夜地训练更聪明的大脑,当TPU 8i在数据中心里以光速处理海量的推理请求时,世界的规则已经被悄然改写。

随着智能体大量投入应用,AI再也不是为人赋能的工具,而是真正成为可以替代人的执行者。

在这种情况下,绝大部分企业其实没有选择。

你不用,你的对手用怎么办?

最原始的生存法则一定会使得智能体在企业端的需求得到完全释放。

最终,必然会造成两个显而易见的后果。

首先,市场格局进一步两极分化。

智能体的研发和部署,都需要海量的资金、技术和人才,少数巨头通过加大投入掌控智能体的核心技术和基础设施,将进一步扩大自己的优势;而中小企业,只能在前者构建的生态中,从事一些细分领域的工作,很难再形成竞争力。

其次,谁来买单?

不难想象,随着智能体深度应用,每一个消费者都能得到极致的专属智能服务,享受更舒适便捷的生活。

但是,为这些服务买单的财富,从哪里来?(全文完)

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为任何实际操作建议,交易风险自担。