公众号记得加星标⭐️,第一时间看推送不会错过。
Anthropic 的 Claude 4.6 Opus 和 Claude Code 的需求量飙升。Anthropic 的年度经常性收入 (ARR) 仅一个季度就增长了近三倍,从去年年底的 90 亿美元增至如今的 250 亿美元以上。GLM 和 Kimi K2.5 等开源模型推动了开源模型应用案例的激增。Anthropic、OpenAI 和多家 Neolabs 等公司的融资活动也需要大量 GPU 资源。
这一转折点意味着需求激增,超大规模数据中心和新云平台上的 GPU 出现了抢购潮。
这种新的需求来源推高了整个供应链中产品和服务的价格,从DRAM和NAND存储器到光纤电缆、数据中心托管和燃气轮机。
GPU租赁定价是众多计算相关产品和服务中最新一个面临供应急剧紧张和价格飙升的领域。H100一年期GPU租赁合同的价格已从2025年10月的低点1.70美元/小时/GPU飙升至2026年3月的2.35美元/小时/GPU,涨幅近40%。
所有GPU类型的按需租赁容量均已售罄——尽管近期价格上涨,但那些已经锁定按需实例的用户仍不愿将这些容量放回池中。在2026年初寻找GPU计算资源就像预订最后一班飞机的机票一样,价格高昂,几乎没有空位。
GPU租赁市场将迎来价格飙升
图表显示了 1 年 H100 租赁价格,但这并不能充分反映这一趋势——我们亲身经历的采购计算资源的经验以及市场上其他人的反馈,描绘了一幅更加鲜明的图景。
各种各样不同的应用场景都对高性能计算卡有着强劲的需求,没有一种万能的解决方案。例如,许多推理工作负载,如大规模混合专家(MoE)推理,在最新的大型世界级系统(如GB300 NVL72)上运行效果最佳;而训练工作负载在H100系列显卡上则能获得最佳性价比,因此即使是较老的显卡也依然需求旺盛。
客户正争相以每小时每GPU 14美元的价格购买AWS上的p6-b200竞价型实例,一些Neocloud巨头已不再出售单个节点,H100实例的续约价格与两三年前签订合同时的价格完全相同,一些H100实例的合同甚至续签至2028年,为期四年。即使是寻找8个节点(64个GPU)的H100或H200实例也并非易事——我们询问的供应商中有一半已经售罄,而大多数供应商则直接回复说他们根本没有Hopper GPU的合约到期。
我们甚至听说过,在摩纳哥大奖赛期间,一些计算资源租用者会像出租公寓一样,将集群资源分割并转租出去。难道“新云贫民窟房东”即将崛起?
Blackwell的可用资源也非常紧张。由于对开放权重模型的强劲需求以及推理需求的持续激增,我们了解到,Blackwell新部署的交付周期现在已经延长到六七月份,而且大部分集群目前都已被预订。事实上,从整个市场来看,所有到2026年8月至9月上线的容量都已被预订一空!
GPU租赁价格——卷土重来
但市场是如何走到今天这一步的呢?仅仅六个月前,大多数市场观察人士还对GPU的终端价值持怀疑态度,并认为GPU租赁价格会随着时间的推移而不可避免地大幅下跌。金融分析师们对任何采用六年折旧期计算GPU计算资产的Neocloud或超大规模数据中心运营商都进行了严厉批评。在探讨未来趋势可能如何演变之前,让我们先快速回顾一下目前为止的情况。
在2025年底之前,整个生态系统普遍预期,随着Blackwell架构部署规模的扩大,Hopper(即H100和H200)的租赁价格将大幅下降,因为Blackwell的计算成本要低得多。然而,到了2025年底,情况却恰恰相反:对H100的需求保持稳定,并且在许多情况下还在增长。当时开放权重模型的快速普及和推理需求的加速增长,预示着市场即将迎来一波永无止境的计算需求浪潮。
1 月份是计算领域的下一个转折点,DRAM 和 NAND 的内存价格从几个季度的快速上涨转为完全抛物线式上涨,根据我们的内存模型,LPDDR5 和 DDR5 合约价格在 2026 年第一季度分别实现了约 4 倍和 5 倍的同比涨幅。
为了应对组件成本快速上涨带来的利润风险,原始设备制造商(OEM)开始重新定价人工智能服务器,其价格涨幅远超组件成本的实际涨幅。这使得集群资本投资流程更加复杂,因为更高的服务器购置成本压缩了预期项目回报,迫使一些运营商放缓部署速度或放弃部署。实际上,原本应该投入使用的服务器被搁置,进一步加剧了租赁市场的紧张。
在人工智能服务器价格暴跌导致的服务器采购混乱中,GPU租赁需求明显加速增长,1月和2月期间大部分剩余容量已被完全租出。到了3月,无论租期长短,H100、H200还是B200的租赁容量都几乎一租不可。1月底,GPU一年期租赁价格已突破每小时2美元,2月中下旬较1月底上涨15-20%,预计到3月底还将环比上涨15-20%。
今年年初,原生媒体生成成为需求的主要驱动力——Seedance 和 Nano Banana 等平台正推动代币吞吐量大幅增长,因为用户正在大规模地生成和优化图像和视频。但最显著的需求驱动因素是多代理工作负载的出现,这些工作负载执行多步骤工作流程,以高并发性运行并持续迭代,从而导致代币和计算资源消耗呈抛物线式增长。
只需看看我们在多篇文章中提到的 Claude Code 的发展趋势即可。过去 7 天,SemiAnalysis 公司消耗了数十亿个代币,平均每个代币的成本约为 5 美元/百万枚,但节省的时间以及工作流程和功能的扩展所带来的回报远远超过了这笔成本。SemiAnalysis 现在在工作流程中部署了一系列 AI 工具,其功能远不止简单的搜索和摘要——尤其值得一提的是仪表盘、自动化抓取、大规模数据整理和智能金融建模。我们正在通过Claude Commits Daily
等指标追踪其巨大的需求。按照目前的趋势,我们相信到 2026 年底,Claude Code 将占所有每日提交的 20% 以上。转眼间,AI 已经席卷了整个软件开发领域。对数据集感兴趣的机构客户可以联系我们的API 文档团队。剧透一下:目前的提交数量远高于我们发布时的数量。
我们圈子里几乎每个人都是 Claude Code 的忠实用户——但我们也意识到,我们的社交圈都沉浸在人工智能和半导体领域,因此他们只是冰山一角。对于许多财富 500 强企业乃至整个世界而言,Claude Code 和智能体世界只不过是他们 Facebook 信息流或喜爱的 NPR 播客中偶尔出现的一个古怪话题。他们完全没有意识到智能体世界即将给世界带来多么巨大的生产力提升和变革。
随着更广泛的经济领域中那些意识到人工智能工具带来的惊人投资回报的人们加入我们,共同乘风破浪,代币消费量将持续攀升。关于人工智能真正回报的争论如今已尘埃落定——人工智能工具带来的价值远超其使用成本。代币需求曲线的右移和上移,正构成一股强大且相对缺乏弹性(目前而言)的推动力,推高GPU租赁价格。
简而言之,如果使用人工智能工具的投资回报率是5-10倍,那么GPU租赁价格显然还有很长的路要走,才会上涨到足以抑制需求的程度。租赁价格的上涨很可能会进一步推高服务器和组件成本,这一点我们并不感到意外。
(来源:编译自semianalysis)
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4365内容,欢迎关注。
加星标⭐️第一时间看推送
求推荐
热门跟贴