2026年,AI应用规模的扩大带来了算力产业的热度暴涨,一个叫“算力租赁”的概念迅速大众化。顾名思义,在算力卡和集群供给有限的情况下,市场涌现了一批专门提供这类平台服务的企业。
这是一个“钱砸出来”的市场:2026年5月,英伟达Blackwell系列GPU在云端数据中心的现货租赁价格达到每小时4.08美元,较两个月前上涨48%。H100的一年期租赁合同从2025年10月的每卡每小时1.7美元升至2026年3月的2.35美元,涨幅接近40%。
这也是一个关系到万千创新的产业:OpenRouter数据显示,截至2026年4月,全球AI大模型词元总调用量已达27万亿,环比增长18.9%。字节跳动的豆包日均Token消耗量达到120万亿,较发布之初增长1000倍。
而中金则指出,2026年3月全国日均Token调用量突破140万亿,“当Agent的渗透率达到8%时,Agent的总Token消耗量已与Chatbot相当”。
但这仅仅是开始,因为随着Agent普及,增长空间依然能以倍数计算。而市场关心的问题,更多集中在算力租赁模式的分化上——高额采购、高负债率、稀缺渠道、AIDC,名为“算力租赁”概念的企业,实际上在依赖不同的模式展业。它们必须回答三个问题:
谁在赚景气本身的钱,谁在赚壁垒的钱,谁又在用杠杆追逐明天。
一、算力为什么需要租赁?
算力租赁不是一个新概念。由于算力需要依附于服务器,所以早期的模式便是转租——平台采购GPU挂在网上按小时计价,客户按需使用,就像云端的自动售货机一样。
不过,当AI应用成为主要的消耗者,算力租赁需求的驱动力,也就变成了需求从训练为主转向推理为主的结构性迁徙。
训练阶段的算力需求是脉冲式的。一个大模型训练一次可能需要数千块GPU连续运行数月,但训练结束后需求就会断崖式下降。而推理阶段的需求则是持续增长的,与用户规模和调用频率正相关。OpenAI、豆包或者DeepSeek的每一次API调用,背后都在消耗Token。Token消耗越多,需要的推理算力就越多。
不少机构测算显示,目前AI领域的推理算力需求已经是训练阶段的10到15倍。这个倍数还会继续扩大,因为推理需求跟着用户量走,而训练需求只跟着模型迭代周期走。
过去,算力租赁卖的是GPU运行时间,客户按小时付费,实际利用率取决于客户自身的技术能力。现在市场正在向Token分成模式迁移——客户不再关心租了多少小时,只关心模型生成了多少Token、完成了多少任务。
于是,行业出现了升级。算力租赁商需要提供的不再只是裸金属算力,而是配套的调度、优化和模型适配能力。硬件采购规模仍然重要,但单位硬件的产出效率开始变得同等甚至更加重要。此时,硬件的高端与否决定了最基础的性能上限,所以中国部分高端GPU机型在租赁平台出现上架即秒光的现象。
这种紧张不是短期的库存波动,而是供给端存在刚性约束的表征。
更重要的是,从“卖算力”到“卖Token”,本质上是从资源型生意向服务型生意的转变。资源型生意的护城河是谁的卡多,服务型生意的护城河是谁能让同样的卡产出更多Token。市场依然对算力租赁充满期待,因为它们相信,最终会有一个“天选之人”打破常规模式 。
二、多元转型殊途同归,短期逻辑可“相信”不可“迷信”
2026年以来,算力租赁概念火热,中国信通院数据显示,2026年一季度国内算力租赁市场规模达680亿元,同比增长62%。这导致不少公司跨界而来,宣称要以各种形式转型。
例如,市值仅130亿元左右的赛意信息在5月中旬宣布计划最高投入200亿元开展算力服务器融资租赁业务。今年早些时候,火电领域的豫能控股通过增资11亿元参股“先天算力(河南)科技有限公司”,成功切入数据中心(IDC)与算力运营领域,走向“算电协同”。
像这种模式的不同,在市场上还有很多案例。
协创数据是从消费电子制造转型而来的算力新贵,前身是做U盘和摄像头的代工厂。2023年切入服务器再制造,随后大规模采购高端GPU,做起了算力租赁。转型的力度和速度都相当惊人。
2025年全年,其智能算力产品及服务业务收入27.61亿元,同比增长超过1700%。2026年一季度营收60.85亿元,同比增长193%,归母净利润7.5亿元,同比增长343%。
不过,由于算力产业属于重资产,所以2025年至今,协创数据先后披露了6次大规模采购计划,累计采购AI服务器金额超过320亿元。截至2026年一季度末,公司总负债规模达到316.9亿元,同比大增382%,资产负债率升至85.89%。
这类策略可以概括为杠杆驱动规模、规模驱动份额。在景气上行期,新增算力能够快速转换为收入。一季度,协创数据实现经营性现金流2.72亿元,同比增长146%,说明投入的产能确实在产生回报。
但它的隐性短板在于,GPU存在更新周期,而这个周期由上游企业决定,尽管GPU更新后前代产品依然有算力价值,但企业需要追加投入。如果新一代产品的商用导致上一代设备租金承压,账面折旧尚未完成,实际盈利已经缩水,利润表会出现时间错配,进而再次放大资产投入压力。
英伟达Blackwell之后Vera Rubin平台已承诺今年下半年出货,且明后两年均有更新计划,这意味着算力租赁也必须“追风”。
和协创数据相比,行业另一龙头利通电子是国内唯一一家获得英伟达Preferred级AI云伙伴资质的企业,这让它的优势主要集中在高端GPU的优先直供权、长协锁价权和稳定配额方面。它是租赁的重要通道,且在某些方面具有唯一性。
2026年一季度,利通电子营收9.97亿元,同比增长41.61%,归母净利润2.71亿元,同比增长821%。毛利率46.23%,在算力租赁赛道中处于领先水平。合同负债高达21.72亿元,同比增长72倍,代表已签订但尚未执行完毕的租约价值。
从公开信息可知,与腾讯签订的50亿元3年长协占其80%算力产能,上架率100%,订单排至2027年之后。
与协创数据相比,利通电子的规模更小但壁垒更硬。它的护城河不是资本投入规模,而是一张资质证书和由此绑定的核心客户关系。它的利润率更高、现金流的可预测性更强、受技术迭代冲击的敏感性更低,但扩张速度受限于英伟达的配额分配节奏。
除此之外,由于“卖Token”正在成为AI赛道的主流商业模式,所以“算力工厂”概念也随之兴起,并诞生了相应的代表性企业——润泽科技。
润泽科技原业务为传统IDC托管,但目前正在向AIDC智算中心运营升级。2025年,其AIDC业务收入25.1亿元,同比增长73%,毛利率48.5%。客户已覆盖国内头部互联网企业和主流AI客户群。润泽科技依托原有业务基础,占据一线城市周边的土地和电力资源禀赋,然后提供从基础设施到算力调度的全栈服务。
除了这些参与者,业内弘信电子、拓维信息等公司均形成了自己的模式,绑定不同的算力来源,共同参与“做蛋糕”“分蛋糕”。市场给这些公司的定价存在一个普遍倾向:把高景气等同于高确定性,把营收增速等同于经营质量。
虽然“科技股不看PE”是个放之四海皆准的道理,但同一个景气周期里,不同商业模式承受的风险类型完全不同。杠杆扩张承担的是财务风险和资产贬值风险,资质壁垒承担的是政策风险和技术路线风险,而硬件销售承担的是毛利率压力和回款周期风险。未来,决定谁能穿越周期的,是各自风险敞口的大小和可管理程度。
三、利剑悬头顶:“租”的护城河是什么?
行业高景气容易制造一种错觉:增长会一直持续,租金会一直坚挺,但制造业的根本属性决定了,供给总会有跟上的一天。因此,针对算力,市场上存在两种观点:一种是短期内算力供给不可能达标,另一种是不管算力供给怎么样,市场已经提前预期了潜在涨幅,导致了泡沫。
如何判断算力租赁乃至其整个产业是否走在正确的道路上?有两个重要的方向值得关注。
一方面,是GPU集群的利用率。为什么去年以来CPO、光纤等行业热度也在攀升?因为它们直接关系到信号的传播效率与损耗程度,而这种限制又会影响算力的上限,所以集群内部和集群与集群之间的通信尤为重要。
未经优化的GPU集群平均利用率仅20%到30%,通过算力池化和智能调度可以提升至70%以上。即便坐拥同样配置的计算卡,用得好与用不好之间,有效产出相差两到三倍。算力租赁的核心竞争力正在从卡的数量向卡的利用效率迁移。
当供给紧张时,有卡就能赚钱,效率低也可以被高租金覆盖。但随着全球GPU总供给将逐步追赶需求,一旦租金从高位回落,效率差异就会直接转化为利润差异。利用率70%的集群仍然赚钱,利用率20%的集群已经亏钱。
另一方面,便是商业模式的分化效应,包括“Token工厂”“算力工厂”概念的崛起,都与这种变化有关。
当客户按Token付费而不按小时付费时,算力租赁商的实际收入取决于单位时间内能生成的Token数量。同样一块GPU,运行经过深度优化的推理框架和运行未经调优的裸模型,Token输出量可能相差数倍。Token定价模式下,表面上计算卡的算力有上限,但产出比率不同,就会导致算力租赁企业获得的利润空间不同。
总之,算力租赁是一个典型的景气驱动型行业。当前的租金水平、合同负债的快速增长、主要客户的资本开支指引,都指向短期的高确定性。但高确定性不意味着低风险。业绩会告诉市场过去发生了什么,资产负债表和竞争格局能够帮助预期未来会发生什么。
在AI成为“人均拥有”的应用之前,这种确定性与不确定性共舞的状态,将始终存在,在螺旋运动中前进。
来源:松果财经
热门跟贴