高杠杆、高景气、高悬念：拆解算力租赁的真实底色|现金流|租赁|算力|高景气

2026年，AI应用规模的扩大带来了算力产业的热度暴涨，一个叫“算力租赁”的概念迅速大众化。顾名思义，在算力卡和集群供给有限的情况下，市场涌现了一批专门提供这类平台服务的企业。

这是一个“钱砸出来”的市场：2026年5月，英伟达Blackwell系列GPU在云端数据中心的现货租赁价格达到每小时4.08美元，较两个月前上涨48%。H100的一年期租赁合同从2025年10月的每卡每小时1.7美元升至2026年3月的2.35美元，涨幅接近40%。

这也是一个关系到万千创新的产业：OpenRouter数据显示，截至2026年4月，全球AI大模型词元总调用量已达27万亿，环比增长18.9%。字节跳动的豆包日均Token消耗量达到120万亿，较发布之初增长1000倍。

而中金则指出，2026年3月全国日均Token调用量突破140万亿，“当Agent的渗透率达到8%时，Agent的总Token消耗量已与Chatbot相当”。

但这仅仅是开始，因为随着Agent普及，增长空间依然能以倍数计算。而市场关心的问题，更多集中在算力租赁模式的分化上——高额采购、高负债率、稀缺渠道、AIDC，名为“算力租赁”概念的企业，实际上在依赖不同的模式展业。它们必须回答三个问题：

谁在赚景气本身的钱，谁在赚壁垒的钱，谁又在用杠杆追逐明天。

一、算力为什么需要租赁？

算力租赁不是一个新概念。由于算力需要依附于服务器，所以早期的模式便是转租——平台采购GPU挂在网上按小时计价，客户按需使用，就像云端的自动售货机一样。

不过，当AI应用成为主要的消耗者，算力租赁需求的驱动力，也就变成了需求从训练为主转向推理为主的结构性迁徙。

训练阶段的算力需求是脉冲式的。一个大模型训练一次可能需要数千块GPU连续运行数月，但训练结束后需求就会断崖式下降。而推理阶段的需求则是持续增长的，与用户规模和调用频率正相关。OpenAI、豆包或者DeepSeek的每一次API调用，背后都在消耗Token。Token消耗越多，需要的推理算力就越多。

不少机构测算显示，目前AI领域的推理算力需求已经是训练阶段的10到15倍。这个倍数还会继续扩大，因为推理需求跟着用户量走，而训练需求只跟着模型迭代周期走。

过去，算力租赁卖的是GPU运行时间，客户按小时付费，实际利用率取决于客户自身的技术能力。现在市场正在向Token分成模式迁移——客户不再关心租了多少小时，只关心模型生成了多少Token、完成了多少任务。

于是，行业出现了升级。算力租赁商需要提供的不再只是裸金属算力，而是配套的调度、优化和模型适配能力。硬件采购规模仍然重要，但单位硬件的产出效率开始变得同等甚至更加重要。此时，硬件的高端与否决定了最基础的性能上限，所以中国部分高端GPU机型在租赁平台出现上架即秒光的现象。

这种紧张不是短期的库存波动，而是供给端存在刚性约束的表征。

更重要的是，从“卖算力”到“卖Token”，本质上是从资源型生意向服务型生意的转变。资源型生意的护城河是谁的卡多，服务型生意的护城河是谁能让同样的卡产出更多Token。市场依然对算力租赁充满期待，因为它们相信，最终会有一个“天选之人”打破常规模式。

二、多元转型殊途同归，短期逻辑可“相信”不可“迷信”

2026年以来，算力租赁概念火热，中国信通院数据显示，2026年一季度国内算力租赁市场规模达680亿元，同比增长62%。这导致不少公司跨界而来，宣称要以各种形式转型。

例如，市值仅130亿元左右的赛意信息在5月中旬宣布计划最高投入200亿元开展算力服务器融资租赁业务。今年早些时候，火电领域的豫能控股通过增资11亿元参股“先天算力（河南）科技有限公司”，成功切入数据中心（IDC）与算力运营领域，走向“算电协同”。

像这种模式的不同，在市场上还有很多案例。

协创数据是从消费电子制造转型而来的算力新贵，前身是做U盘和摄像头的代工厂。2023年切入服务器再制造，随后大规模采购高端GPU，做起了算力租赁。转型的力度和速度都相当惊人。

2025年全年，其智能算力产品及服务业务收入27.61亿元，同比增长超过1700%。2026年一季度营收60.85亿元，同比增长193%，归母净利润7.5亿元，同比增长343%。

不过，由于算力产业属于重资产，所以2025年至今，协创数据先后披露了6次大规模采购计划，累计采购AI服务器金额超过320亿元。截至2026年一季度末，公司总负债规模达到316.9亿元，同比大增382%，资产负债率升至85.89%。

这类策略可以概括为杠杆驱动规模、规模驱动份额。在景气上行期，新增算力能够快速转换为收入。一季度，协创数据实现经营性现金流2.72亿元，同比增长146%，说明投入的产能确实在产生回报。

但它的隐性短板在于，GPU存在更新周期，而这个周期由上游企业决定，尽管GPU更新后前代产品依然有算力价值，但企业需要追加投入。如果新一代产品的商用导致上一代设备租金承压，账面折旧尚未完成，实际盈利已经缩水，利润表会出现时间错配，进而再次放大资产投入压力。

英伟达Blackwell之后Vera Rubin平台已承诺今年下半年出货，且明后两年均有更新计划，这意味着算力租赁也必须“追风”。

和协创数据相比，行业另一龙头利通电子是国内唯一一家获得英伟达Preferred级AI云伙伴资质的企业，这让它的优势主要集中在高端GPU的优先直供权、长协锁价权和稳定配额方面。它是租赁的重要通道，且在某些方面具有唯一性。

2026年一季度，利通电子营收9.97亿元，同比增长41.61%，归母净利润2.71亿元，同比增长821%。毛利率46.23%，在算力租赁赛道中处于领先水平。合同负债高达21.72亿元，同比增长72倍，代表已签订但尚未执行完毕的租约价值。

从公开信息可知，与腾讯签订的50亿元3年长协占其80%算力产能，上架率100%，订单排至2027年之后。

与协创数据相比，利通电子的规模更小但壁垒更硬。它的护城河不是资本投入规模，而是一张资质证书和由此绑定的核心客户关系。它的利润率更高、现金流的可预测性更强、受技术迭代冲击的敏感性更低，但扩张速度受限于英伟达的配额分配节奏。

除此之外，由于“卖Token”正在成为AI赛道的主流商业模式，所以“算力工厂”概念也随之兴起，并诞生了相应的代表性企业——润泽科技。

润泽科技原业务为传统IDC托管，但目前正在向AIDC智算中心运营升级。2025年，其AIDC业务收入25.1亿元，同比增长73%，毛利率48.5%。客户已覆盖国内头部互联网企业和主流AI客户群。润泽科技依托原有业务基础，占据一线城市周边的土地和电力资源禀赋，然后提供从基础设施到算力调度的全栈服务。

除了这些参与者，业内弘信电子、拓维信息等公司均形成了自己的模式，绑定不同的算力来源，共同参与“做蛋糕”“分蛋糕”。市场给这些公司的定价存在一个普遍倾向：把高景气等同于高确定性，把营收增速等同于经营质量。

虽然“科技股不看PE”是个放之四海皆准的道理，但同一个景气周期里，不同商业模式承受的风险类型完全不同。杠杆扩张承担的是财务风险和资产贬值风险，资质壁垒承担的是政策风险和技术路线风险，而硬件销售承担的是毛利率压力和回款周期风险。未来，决定谁能穿越周期的，是各自风险敞口的大小和可管理程度。

三、利剑悬头顶：“租”的护城河是什么？

行业高景气容易制造一种错觉：增长会一直持续，租金会一直坚挺，但制造业的根本属性决定了，供给总会有跟上的一天。因此，针对算力，市场上存在两种观点：一种是短期内算力供给不可能达标，另一种是不管算力供给怎么样，市场已经提前预期了潜在涨幅，导致了泡沫。

如何判断算力租赁乃至其整个产业是否走在正确的道路上？有两个重要的方向值得关注。

一方面，是GPU集群的利用率。为什么去年以来CPO、光纤等行业热度也在攀升？因为它们直接关系到信号的传播效率与损耗程度，而这种限制又会影响算力的上限，所以集群内部和集群与集群之间的通信尤为重要。

未经优化的GPU集群平均利用率仅20%到30%，通过算力池化和智能调度可以提升至70%以上。即便坐拥同样配置的计算卡，用得好与用不好之间，有效产出相差两到三倍。算力租赁的核心竞争力正在从卡的数量向卡的利用效率迁移。

当供给紧张时，有卡就能赚钱，效率低也可以被高租金覆盖。但随着全球GPU总供给将逐步追赶需求，一旦租金从高位回落，效率差异就会直接转化为利润差异。利用率70%的集群仍然赚钱，利用率20%的集群已经亏钱。

另一方面，便是商业模式的分化效应，包括“Token工厂”“算力工厂”概念的崛起，都与这种变化有关。

当客户按Token付费而不按小时付费时，算力租赁商的实际收入取决于单位时间内能生成的Token数量。同样一块GPU，运行经过深度优化的推理框架和运行未经调优的裸模型，Token输出量可能相差数倍。Token定价模式下，表面上计算卡的算力有上限，但产出比率不同，就会导致算力租赁企业获得的利润空间不同。