财联社4月3日讯(编辑 史正丞)随着新年以来Anthropic、字节跳动等AI巨头不断发布爆款应用,叠加“龙虾”热潮推动开源大模型的调用激增,英伟达的H100芯片在租赁市场迎来身价“V型”反转的高光时刻。
要知道,这款芯片是黄仁勋在2022年3月GTC上发布,同年秋季开始出货的产品。
据半导体研究机构SemiAnalysis周四推出的“H100一年期租赁合约价格指数”,这款“老芯片”的租赁合约价格从2025年10月触及每小时1.7美元后,已经在今年3月飙升至每小时每块GPU 2.35美元,飙升近40%。
(来源:SemiAnalysis)
该指数基于对100多家云服务提供商、算力资源的买家和卖家进行的直接调查数据构建,每月采集一次。
最新报告指出,按需租用的GPU算力在所有类型GPU中都已售罄——即便近期价格上涨,那些已经锁定按需实例的客户也不愿把这些算力释放回资源池。该机构也比喻称,在2026年初寻找GPU算力,就像试图预订“最后一班离开航班”的机票一样:价格高昂,而且几乎没有可用资源。
研究人员补充称:“客户正争相以每块GPU每小时14美元的价格抢购亚马逊云服务的p6-b200竞价实例,一些新兴云服务巨头(Neocloud Giants)甚至已经不再提供单节点销售;部分英伟达H100 GPU仍按2—3年前签订时的原价续约,甚至有些H100合同直接续签到2028年。”
至于架构更先进的Blackwell芯片?研究人员表示,由于对开放权重模型的强劲需求以及推理需求的持续激增,新部署Blackwell的交付周期现在正延长至6到7个月。
在2025年晚些时候,市场一度预期随着性能更强、算力成本更低的Blackwell芯片加速部署,Hopper芯片(H100、H200)的租赁价格可能会出现大幅下降。但最新的情况恰恰相反,现在市场对H100的需求不仅保持坚挺,在许多情况下甚至还在增强。
SemiAnalysis在报告中指出,今年初算力需求的重要驱动因素之一来自原生媒体生成。例如,字节跳动的Seedance(即梦)和谷歌Nano Banana驱动用户大量生成和优化视频/图像期间,推动词元(token)吞吐量大幅上升。更显著的需求来源是多智能体(multi-agent)工作负载的兴起,推动词元使用量和算力消耗呈抛物线式增长。
SemiAnalysis表示,光是他们自己“在过去一周里就消耗数十亿词元”,每百万词元成本在5美元左右。不过公司也心满意足地表示,由此节省的时间以及工作流程与能力的扩展,带来的回报远超算力成本。
报告也指出,算力供应收紧且价格上涨的动态,与广泛的市场情绪存在脱节。CoreWeave、Nebius等新兴云服务商的股价正处于过去6到12个月区间的低端。分析指出,目前市场仍然锚定在“终将出现供给过剩与算力商品化”的叙事框架上。但现实的情况却是,在激进的供给紧张环境下,几乎所有类型的算力资源都会保持旺盛需求——无论其相对性能差异如何。
展望未来,研究人员给出三个关键观察点来判断GPU租赁价格是否仍会维持高位。
首先,随着GB300集群在整个2026年逐步放量,市场将关注新增供给究竟能否缓解当前的算力紧张局面。其次,需要关注持续中的芯片短缺是否进一步恶化。最后,还要观察各大AI巨头的年度经常性收入(ARR)扩张情况,以及AI应用的普及速度和词元消耗规模的持续增长节奏。
热门跟贴