新智元报道
编辑:编辑部 HYZ
【新智元导读】2024年英伟达GPU全球最大买家,竟是微软?购买总量将近50万块,超所有竞争对手近两倍。xAI已开心晒出首批发货的GB200 NVL72,喜滋滋的像是提前过年了。囤的GPU越多,模型就会越好吗?来不及解释了,赶紧上车,车门焊死!
谁是今年英伟达GPU的最大买家?
就在刚刚,答案曝光——TOP 1竟是微软。
今天,这张对比图在网上被转疯了。
根据各公司公开披露的资本支出、服务器出货量和供应链情报,Omdia估计了大致数额
根据技术咨询公司Omdia的分析师估计,微软今年购买了48.5万块英伟达Hopper芯片,位列全球GPU买家的TOP 1。
这就使微软远远领先于英伟达的第二大美国客户——购买了22.4万块Hopper芯片的Meta。
在Meta之后的,就是xAI、亚马逊(19.6万块)和谷歌(16.9万块)。
而且,Hopper的下一代GPU Blackwell马上就要来了,英伟达还能大赚一波。
总之,随着全球大科技公司疯狂囤GPU,争相组装越来越大的GPU集群,英伟达的市值今年已经飙涨至3万亿美元。
这不,xAI已经开心晒出了首批发货的英伟达GB200 NVL72,Colossus这个世界上最大的超算集群,会变成更大的庞然巨物。
感觉xAI都要笑出声来了:「xAI的Colossus提前过圣诞啰」
可以看到,11月18日,戴尔创始人兼CEO Michael Dell就表示:世界上第一个英伟达GB200 NVL72服务器机架现已发货。AI火箭要起飞了!
不过,只要有最好的芯片,就一定能构建最好的AI基础设施呢?其实未必。
微软Azure全球基础设施高级总监Alistair Speirs表示,除此之外,还需要搭配合适的存储组件、基础设施、软件层、主机管理层、错误纠正功能,以及构建完整系统所需的各项组件。
比如坐拥全球最强超算的Grok——虽然有不少测试指出它的表现十分出色,但依然经常被网友泼冷水说:拥有世界上数量最多的GPU,并不意味着你的模型就更好。
但是来不及解释了,全世界的GPU购买潮已经到了最高峰,所有巨头心里想的只有一句话——快上车!
微软,全球最大英伟达GPU买家
过去两年里,英伟达最先进的GPU一直供不应求,而在CEO纳德拉的指示下,微软可谓是卯足了全力!
从Omdia的数据中可以看出,微软今年买了将近50万块GPU,数量是竞争对手的2倍之多。与此同时,也坐稳了投资金额榜一的位置。
为了扩建数据中心基础设施,微软已向OpenAI投资130亿美元。这些设施既用于运行Copilot等自身的AI服务,也会通过Azure租给客户。
OpenAI最新的o1模型,就是用微软的Azure云基础设施训练的。联手的这两方,正在和强势回归的谷歌、Anthropic、xAI等公司,激烈争夺着下一代计算技术的制高点。
ChatGPT的成功,让英伟达连夜加紧扩大Hopper芯片的生产。
而相比2023年购入的同代英伟达AI处理器,微软这次订购的数量增加了两倍多。
根据微软Azure全球基础设施高级总监Alistair Speirs的说法,如今高质量的数据中心基础设施,已经变成了极其复杂的「资本密集型项目」。
这需要多年规划。因此,准确预测增长需求并保持适当的缓冲余量至关重要。
的确,现在英伟达GPU已经成为硅谷最热门的硬通货,引发了前所未有的AI投资大暴增。
据Omdia预计,2024年服务器支出中,约有43%投向了英伟达。
其中,数据中心基础设施的前十大买家(现包括新晋的xAI和CoreWeave在内),占据了全球计算能力投资的60%。
而全球科技公司在服务器上的支出,则将达到2,290亿美元这一惊人数字——微软为310亿美元,亚马逊为260亿美元。
Omdia云计算和数据中心研究主管Vlad Galabov表示:「英伟达GPU在服务器资本支出中占据了极高份额,已接近峰值水平。」
异军突起,挑战英伟达霸主
不过,英伟达也不能笑得太早。
虽然目前它仍主导着AI芯片市场,但它的老对手AMD也一直在对这块市场虎视眈眈。
目前,AMD已取得了突破性进展。据Omdia统计,Meta今年采购了17.3万块AMD MI300芯片,微软也购入了9.6万块。
更值得注意的是,各大科技巨头纷纷极速布局自研AI芯片,降低对英伟达的依赖程度。
作为先行者,谷歌潜心研发十年TPU;Meta在去年首次推出第一代训推加速器芯片。
他们分别部署了约150块自研芯片。
另有,全球最大云计算服务巨头亚马逊,在AI芯片领域的动作引人注目。
目前,亚马逊自研的Trainium和Inferentia芯片,今年已经部署约130万块。
几周前,他们官宣将使用数十万块最新Trainium芯片搭建超算集群,主要是向投资了80亿美金的Anthropic提供算力支持,用来训练下一代模型。
相较之下,微软在AI加速器研发方面,还处于起步阶段。,一共部署了20万块Maia芯片。
在这之中,针对谷歌TPU芯片的需求,增长最快。甚至,强劲到足以撼动英伟达GPU的主导市场地位。
在Broadcom第三季度业绩报告中,提供了一些重要的线索。
作为谷歌、Meta等多家科技巨头的供应商,Broadcom为他们提供了半导体解决方案,其内部数据揭示了一些鲜为人知的采购趋势和信息。
比如,谷歌购买了多少块定制处理器等等。
Broadcom CEO陈福阳多次上调了半导体收入,并将今年目标设定在120亿美金。
基于此,谷歌TPU带来的收入预计在60亿-90亿美元之间,具体还得取决于计算设备和网络设备的配比。
Omdia首席分析师Alexander Harrowell指出,「尽管计算设备和网络设备的具体比例存在一些不确定性,但即使按照较低的60亿美元估计,TPU出货量的增长速度也足以首次从英伟达手中抢占市场份额」。
他继续道,「谷歌云业务在总收入中占比持续增长,盈利也在不断提升」。
这背后,很可能就是TPU加速实例和基于TPU的AI产品在发挥作用。
除了谷歌,Broadcom还在为Meta、字节这三个主要客户开发定制AI芯片(ASIC)。并且,它还与与另外两个客户合作开发下一代AIXPU。
从这点可以看出,许多云服务提供商青睐ASIC,而非英伟达GPU,主要是因为前者在成本效益上更具优势,能够以更高性价比优化内部工作负载。
摩根士丹利估计,在云服务提供商推动下,定制AI芯片市场规模将从2024年的1200亿美元,增长到2027年的3000亿美元,增速将超过GPU市场。
TPU、定制芯片的崛起,让激烈的AI芯片市场的竞争格局正发生深刻变化。
参考资料:
https://www.ft.com/content/e85e43d1-5ce4-4531-94f1-9e9c1c5b4ff1
https://omdia.tech.informa.com/pr/2024/dec/omdia-demand-for-googles-tpu-chips-accelerates-challenging-nvidias-dominance
热门跟贴