今天早上刷到好多新闻都在说Meta和英伟达签了个大单。不是那种“合作意向”,是真的要买数百万颗芯片,包括刚出来的Grace CPU、正在赶工的Rubin,还有早就用着的Blackwell GPU。这单子没说多少钱,但有分析师直接说“肯定几百亿美元起”,因为光是Meta今年AI投入就顶到1350亿了。

打开网易新闻 查看精彩图片

以前Meta自己搞芯片,也用AMD,还跟谷歌TPU有过接触。这次却把Grace CPU的首发权给了英伟达,而且是“大规模独立部署”,不是插在GPU旁边当配角。意思很明白:推理层的底座,他们选了英伟达的CPU,不是临时凑数,是打算长期靠它跑AI服务。

为啥?因为“个人超级智能”这个目标太烧硬件了。不是光堆算力就行,得快、得省电、得能同时服务几亿人。GPU带宽快撑不住,而Grace+Rubin+网络交换机一起调优,能压低延迟、减少数据搬来搬去的损耗。说白了,不是Meta买不起,是别的方案现在没法满足它要的响应速度和并发量。

英伟达这次也不只是卖货。它把CPU、GPU、DPU、以太网交换机全打包进一个协议里,等于在教客户怎么建“智能单元”——不是拼硬件,是拼整套能跑起来的系统。俄亥俄和路易斯安那两个超大新数据中心,用的已经是Vera Rubin机柜为单位的设计,一柜子就把计算、互联、安全全包了。

但问题也明摆着。Grace用的是Arm架构,Meta以前全是x86环境训练模型,软件重写、调试、迁移,少说也得折腾一年。芯片制造在哪?协议里没提。全球高端芯片产能就那么些,数百万颗不是小数目,万一出点状况,交付卡壳,Meta的AI节奏就得跟着停。

还有,它自家的Avocado大模型进展不太声张,Llama更新也慢了半拍。外购越来越猛,自研芯片反而少了消息。是不是有点着急了?反垄断那边也没消停,美国司法部盯着呢,这次全栈绑定,说不定哪天就成了调查材料里的重点一页。

协议签得爽快,新闻稿写得漂亮,可芯片装进机房、代码跑通、用户真感觉到“快了”,才算落地。不然再大的单子,也只是纸上写的数字。

Meta,英伟达,AI基建。