伴随Agent应用和多模态生态的爆发,全球Token用量正迎来新一轮加速增长。根据OpenRouter数据,过去一年周度消耗Token数量从2.1T上升至24.5T,2026年以来周度Token消耗增加280%。国内模型厂和云平台纷纷下调Coding Plan的额度和优惠,智谱等厂商的Coding Plan产品出现了限购现象。从核心产商来看,根据各公司公告,国内字节(豆包)2025年12月的日均Token消耗量达63万亿,与海外龙头OpenAI(52万亿)及谷歌(65万亿)基本处于同一量级;而豆包2026年3月的日均Token消耗量突破120万亿,三个月内基本实现翻倍增长。

此外,SemiAnalysis数据显示,算力租赁价格呈现上涨趋势,截至2026年4月,海外H100租赁价格5个月内上涨40%。算力租赁行业当前的高景气度主要源于国内算力市场的供需错配,下游大模型与互联网厂商算力需求爆发,而部分国产高端芯片一定程度上受制于代工产能瓶颈,使得掌握高端算力芯片资源的头部租赁公司卡位优势更加凸显。

中信证券表示,伴随Agent应用和多模态生态的爆发,资本开支与算力需求错配,全球Token用量正迎来新一轮加速增长,近两年云产业链有望进入量价齐升的发展大年。云产业链方面,需求推升价格水平,云产业链进入量价齐升周期。算力租赁方面,优质算力芯片供给偏紧,头部算力租赁厂商卡位优势突出,较高杠杆提升高增确定性。建议关注云产业链及算力租赁相关标的。