Google Cloud每年烧掉200亿美元基础设施成本,其中芯片采购占了大头。这家巨头刚刚做了一个让Intel股价当天涨4%的决定——继续买它的网卡,而不是像AWS那样自己造。
这笔订单的隐蔽性,恰恰说明了数据中心战争的残酷真相:有时候,"不折腾"本身就是战略。
2022年的伏笔:Mount Evans的诞生
故事要从三年前说起。当时Google的C3实例上线,配套的ASIC芯片Mount Evans首次亮相。这不是Google自研,而是Intel定制开发的IPU(基础设施处理单元,SmartNIC的另一种叫法)。
Mount Evans的规格放在今天不算惊艳:200Gbps网络吞吐,专职卸载网络、安全、存储任务,让CPU专心服务租户。但对当时的Google来说,这是追赶AWS Nitro架构的关键一步。
AWS的路径截然不同。2015年收购Annapurna Labs后,贝索斯团队花了七年时间把Nitro做成行业标杆——从软件定义网络到硬件卸载,全栈自研。微软选了中间路线:FPGA跑定制逻辑,灵活性优先。
Google的算盘很实际。自研ASIC需要养一支数百人的芯片团队,流片一次数千万美元起跳,周期18-24个月。与其重造轮子,不如借Intel的晶圆厂和设计能力,把风险转嫁出去。
2022年的合作是试探性的。Mount Evans只覆盖部分实例类型,Google内部同时跑着自研的TPU和刚起步的Axion CPU项目。Intel当时急需一个云巨头背书——它的数据中心业务正被AMD Epyc蚕食,市场份额从90%跌到不足70%。
这笔交易对双方都是赌注。Google赌的是Intel能按时交付;Intel赌的是Google不会很快翻脸。
2025年的续约:为什么是现在
Intel在周四的 press release 里用了"expanded collaboration"(扩展合作)这个词。措辞谨慎,但CFO David Zinsner在1月Q4财报电话会上的数字更有说服力:
「我们的定制ASIC业务2025年增长超过50%,Q4年化收入突破10亿美元。」
这是Intel急需的好消息。过去两年,这家曾经的芯片霸主经历了制造延期、市场份额流失、市值被Nvidia超越的连环打击。数据中心和网络部门被反复质疑是否还有存在的必要。
Google的续约相当于一张续命符。但更值得玩味的是续约的时机——AI算力军备竞赛进入白热化阶段,网络带宽成为新瓶颈。
训练一个大模型需要数千张GPU卡互联。H100时代,400Gbps网络是标配;B200时代,800Gbps正在普及。Google的TPU集群同样需要高速互联,200Gbps的Mount Evans显然不够看了。
Intel没有透露下一代IPU的规格,但"significantly faster"(显著更快)的暗示几乎明示了800Gbps甚至1.6Tbps的方向。这对Google的AI基础设施至关重要——它的Gemini模型训练集群需要的东西,Intel正在造。
Xeon的微妙位置:没被抛弃,但也非唯一
Intel在 press release 里花了相当篇幅强调另一件事:Google还在买Xeon处理器。
这听起来像自我安慰,但数据支持这个说法。Nvidia的DGX参考设计从H100时代就用Xeon做配套CPU,Google的GPU实例自然也不例外。AI工作负载需要CPU来编排任务、执行代码,这个需求真实存在。
但Intel的焦虑也写在了脸上。Google 2024年发布了Axion——基于Arm架构的自研CPU,和AWS Graviton、微软Cobalt走同一条路。Axion已经跑在内部工作负载和部分客户实例上。
云厂商的自研CPU有一个共同特点:不追求全面替代,而是精准打击。
Graviton用了八年时间,才覆盖AWS计算实例的半壁江山。Cobalt进度更慢。Axion的策略类似——先吃透对x86兼容性要求不高的场景,比如容器化微服务、无状态计算。
真正让Intel和AMD保持竞争力的,是客户的惰性。大量企业软件针对x86优化,迁移成本高昂。Google Cloud的销售团队清楚这一点:给客户Axion选项的同时,必须保留Xeon和Epyc作为"安全牌"。
这种三方制衡的局面,恰恰是Google想要的结果。Axion压价,Intel和AMD互相压价,最终受益的是Google的毛利率。
不折腾的智慧:Google的供应链哲学
AWS的Nitro是自研芯片的标杆,但Google选择了一条更务实的路。这背后有深刻的组织逻辑。
AWS的芯片团队Annapurna Labs是2015年收购来的,文化独立、目标单一:把网卡做到极致。Google的芯片项目分散在多个团队——TPU归Google Research,Axion归Cloud,IPU原本可能归Infrastructure。协调成本远高于AWS。
更关键的是时机。2022年Google决定合作时,正值疫情后的供应链混乱期。晶圆厂产能紧张,自研芯片的流片窗口难以保证。Intel虽然制造吃紧,但作为供应商的优先级远高于作为客户的Google。
三年后的续约,说明这个判断依然成立。AI竞赛拼的是迭代速度,不是技术纯度。Google需要可靠的芯片供应来支撑Gemini的训练和推理,Intel需要云巨头的订单来维持数据中心业务的叙事。
这种互相需要的关系,比任何技术参数都稳固。
Intel的 press release 被外界解读为"desperate"(绝望),但商业世界的真相往往更平淡:两个巨人各取所需,在不确定的时代寻找确定性。
Google没有变成AWS,这不是能力问题,而是选择问题。当你每年要服务数百万企业客户、运行数十亿查询时,"不折腾"本身就是一种稀缺能力。
下一代Mount Evans会是什么样子?Intel没说,Google也没问。但有一个数字值得记住:10亿美元——这是Intel定制ASIC业务的年化收入门槛,Google的续约让它跨了过去。
当两个公司都不急着证明自己的时候,合作反而能走得更远。问题是,这种默契能持续到Axion成熟、或者Intel的制造彻底翻身的那一天吗?
热门跟贴