打开网易新闻 查看精彩图片

新智元报道

编辑:编辑部 HYZ

【新智元导读】2024年英伟达GPU全球最大买家,竟是微软?购买总量将近50万块,超所有竞争对手近两倍。xAI已开心晒出首批发货的GB200 NVL72,喜滋滋的像是提前过年了。囤的GPU越多,模型就会越好吗?来不及解释了,赶紧上车,车门焊死!

谁是今年英伟达GPU的最大买家?

就在刚刚,答案曝光——TOP 1竟是微软

今天,这张对比图在网上被转疯了。

打开网易新闻 查看精彩图片

根据各公司公开披露的资本支出、服务器出货量和供应链情报,Omdia估计了大致数额

根据技术咨询公司Omdia的分析师估计,微软今年购买了48.5万块英伟达Hopper芯片,位列全球GPU买家的TOP 1。

这就使微软远远领先于英伟达的第二大美国客户——购买了22.4万块Hopper芯片的Meta。

在Meta之后的,就是xAI、亚马逊(19.6万块)和谷歌(16.9万块)。

而且,Hopper的下一代GPU Blackwell马上就要来了,英伟达还能大赚一波。

总之,随着全球大科技公司疯狂囤GPU,争相组装越来越大的GPU集群,英伟达的市值今年已经飙涨至3万亿美元。

这不,xAI已经开心晒出了首批发货的英伟达GB200 NVL72,Colossus这个世界上最大的超算集群,会变成更大的庞然巨物。

打开网易新闻 查看精彩图片

感觉xAI都要笑出声来了:「xAI的Colossus提前过圣诞啰」

可以看到,11月18日,戴尔创始人兼CEO Michael Dell就表示:世界上第一个英伟达GB200 NVL72服务器机架现已发货。AI火箭要起飞了!

打开网易新闻 查看精彩图片

不过,只要有最好的芯片,就一定能构建最好的AI基础设施呢?其实未必。

微软Azure全球基础设施高级总监Alistair Speirs表示,除此之外,还需要搭配合适的存储组件、基础设施、软件层、主机管理层、错误纠正功能,以及构建完整系统所需的各项组件。

比如坐拥全球最强超算的Grok——虽然有不少测试指出它的表现十分出色,但依然经常被网友泼冷水说:拥有世界上数量最多的GPU,并不意味着你的模型就更好。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

但是来不及解释了,全世界的GPU购买潮已经到了最高峰,所有巨头心里想的只有一句话——快上车!

微软,全球最大英伟达GPU买家

过去两年里,英伟达最先进的GPU一直供不应求,而在CEO纳德拉的指示下,微软可谓是卯足了全力!

从Omdia的数据中可以看出,微软今年买了将近50万块GPU,数量是竞争对手的2倍之多。与此同时,也坐稳了投资金额榜一的位置。

打开网易新闻 查看精彩图片

为了扩建数据中心基础设施,微软已向OpenAI投资130亿美元。这些设施既用于运行Copilot等自身的AI服务,也会通过Azure租给客户。

OpenAI最新的o1模型,就是用微软的Azure云基础设施训练的。联手的这两方,正在和强势回归的谷歌、Anthropic、xAI等公司,激烈争夺着下一代计算技术的制高点。

ChatGPT的成功,让英伟达连夜加紧扩大Hopper芯片的生产。

而相比2023年购入的同代英伟达AI处理器,微软这次订购的数量增加了两倍多。

根据微软Azure全球基础设施高级总监Alistair Speirs的说法,如今高质量的数据中心基础设施,已经变成了极其复杂的「资本密集型项目」。

这需要多年规划。因此,准确预测增长需求并保持适当的缓冲余量至关重要。

打开网易新闻 查看精彩图片

的确,现在英伟达GPU已经成为硅谷最热门的硬通货,引发了前所未有的AI投资大暴增。

据Omdia预计,2024年服务器支出中,约有43%投向了英伟达。

其中,数据中心基础设施的前十大买家(现包括新晋的xAI和CoreWeave在内),占据了全球计算能力投资的60%。

而全球科技公司在服务器上的支出,则将达到2,290亿美元这一惊人数字——微软为310亿美元,亚马逊为260亿美元。

Omdia云计算和数据中心研究主管Vlad Galabov表示:「英伟达GPU在服务器资本支出中占据了极高份额,已接近峰值水平。」

异军突起,挑战英伟达霸主

不过,英伟达也不能笑得太早。

虽然目前它仍主导着AI芯片市场,但它的老对手AMD也一直在对这块市场虎视眈眈。

目前,AMD已取得了突破性进展。据Omdia统计,Meta今年采购了17.3万块AMD MI300芯片,微软也购入了9.6万块。

打开网易新闻 查看精彩图片

更值得注意的是,各大科技巨头纷纷极速布局自研AI芯片,降低对英伟达的依赖程度。

作为先行者,谷歌潜心研发十年TPU;Meta在去年首次推出第一代训推加速器芯片。

他们分别部署了约150块自研芯片。

另有,全球最大云计算服务巨头亚马逊,在AI芯片领域的动作引人注目。

打开网易新闻 查看精彩图片

目前,亚马逊自研的Trainium和Inferentia芯片,今年已经部署约130万块。

几周前,他们官宣将使用数十万块最新Trainium芯片搭建超算集群,主要是向投资了80亿美金的Anthropic提供算力支持,用来训练下一代模型。

相较之下,微软在AI加速器研发方面,还处于起步阶段。,一共部署了20万块Maia芯片。

打开网易新闻 查看精彩图片

在这之中,针对谷歌TPU芯片的需求,增长最快。甚至,强劲到足以撼动英伟达GPU的主导市场地位。

在Broadcom第三季度业绩报告中,提供了一些重要的线索。

作为谷歌、Meta等多家科技巨头的供应商,Broadcom为他们提供了半导体解决方案,其内部数据揭示了一些鲜为人知的采购趋势和信息。

比如,谷歌购买了多少块定制处理器等等。

Broadcom CEO陈福阳多次上调了半导体收入,并将今年目标设定在120亿美金。

基于此,谷歌TPU带来的收入预计在60亿-90亿美元之间,具体还得取决于计算设备和网络设备的配比。

Omdia首席分析师Alexander Harrowell指出,「尽管计算设备和网络设备的具体比例存在一些不确定性,但即使按照较低的60亿美元估计,TPU出货量的增长速度也足以首次从英伟达手中抢占市场份额」。

他继续道,「谷歌云业务在总收入中占比持续增长,盈利也在不断提升」。

这背后,很可能就是TPU加速实例和基于TPU的AI产品在发挥作用。

除了谷歌,Broadcom还在为Meta、字节这三个主要客户开发定制AI芯片(ASIC)。并且,它还与与另外两个客户合作开发下一代AIXPU。

从这点可以看出,许多云服务提供商青睐ASIC,而非英伟达GPU,主要是因为前者在成本效益上更具优势,能够以更高性价比优化内部工作负载。

摩根士丹利估计,在云服务提供商推动下,定制AI芯片市场规模将从2024年的1200亿美元,增长到2027年的3000亿美元,增速将超过GPU市场。

TPU、定制芯片的崛起,让激烈的AI芯片市场的竞争格局正发生深刻变化。

参考资料:

https://www.ft.com/content/e85e43d1-5ce4-4531-94f1-9e9c1c5b4ff1

https://omdia.tech.informa.com/pr/2024/dec/omdia-demand-for-googles-tpu-chips-accelerates-challenging-nvidias-dominance