来源:市场资讯

(来源:老司机驾新车)

算力租赁产业交流

全文摘要

1、算力租赁行业供需与价格趋势

·行业需求端增长特征:2026年以来算力租赁需求增长核心来自两大驱动:一是AI应用Token消耗爆发,二是大量非人工智能行业企业为优化工作流程、提升运营效率,全面转向AI工具应用。此前纠结是否投入算力建设、开展AI相关研发的非AI企业,2026年上半年已明确决策,要求内部研发、IT部门全面尝试AI应用落地,资金充裕的直接自购GPU设备,其余企业则加大云算力租用力度,阿里云、火山云、腾讯云等云服务用户均在大力推进云端算力服务采购。国内头部互联网厂商正加速GPU算力基础设施布局,单体项目规模较去年至少翻2-3倍,布局节奏明显加快。

·算力租赁价格变化情况:三年前英伟达H100的三年锁定算力租赁合同,公允月租金为每台6.5万-7万元,该价格为市场平均水平,不同项目存在小幅波动。2026年部分三年前签订的算力租赁合同陆续到期,原有合同的定价规则主要分为两类:一类约定到期后重新议价,一类约定到期后按照新的市场租赁价格由资产方与算力运营方按初始投资比例分成,例如此前部分到期合同约定租金降至每月每台4万元再按比例分成。但当前到期合约不再沿用原有模式,统一采用竞价规则,优先向出价更高的需求方出租,不再受原有定价条款限制。同时算力租赁市场租期偏好明显转变,租赁方不再优先要求长租,部分项目甚至更倾向于短租订单。

·价格后续走势与供给逻辑:算力租赁价格至少2年内将维持上涨趋势,核心原因是算力供给规模远不及市场需求。当前国内绝大多数应用场景的算力需求均依赖英伟达GPU,涵盖老款A系列、H系列及最新B系列、GB系列等产品,但中美关系导致英伟达GPU进口受限,供给缺口长期存在。国产GPU2年内无法实现大规模替代,仅在部分零星、有政策引导甚至强制性要求的场景存在少量替代应用,且这类替代并不完全符合正常商业化逻辑。大量中小规模创业公司等零散算力需求用户,出于适配英伟达成熟生态、降低工作流转化成本的考量,无主动尝试国产GPU的意愿,进一步限制了国产GPU的替代进度。

·云厂商涨价行为逻辑:2026年以来阿里云、腾讯云等头部云厂商针对部分服务上浮价格,本质是将紧俏的GPU算力服务作为商务杠杆,并非面向所有客户全面涨价。云厂商对不同客户群体定价策略差异明显:对年消费额较高的核心大客户,不仅不涨价,反而会通过降价等方式留存;对年消费额1000万以内的中等体量用户,云厂商以算力资源优先级为条件推动涨价,这类用户通常不愿自行搭建GPU服务器集群,希望在原有云平台上平滑扩容GPU服务,对涨价接受度较高;对新开通的云服务用户,折扣力度有所收窄,从去年的官网价4折调整为当前的5折,若用户要求维持4折优惠则无法获得GPU算力服务的供给保障。此外工信部指导全行业禁止无底线价格战,也是云服务定价调整的重要推手,此前云服务、数据中心等行业长期存在内卷式价格战,政策引导下行业定价逐步回归合理区间。

2、国内外算力租赁商业模式对比

·海外算力租赁商业模式:算力资产收购、倒卖类的商业模式仅在国内较为普遍,海外市场无此类运作模式。其中一带一路沿线的中东、西亚等国家自身不具备算力相关产业能力,也没有完整的算力产业链,算力部署完全采用中国企业提供的方案。这类国家的算力合作核心逻辑为:中方先行投资算力相关项目,以此换取当地的资源,相关资源可后续变现产生其他收益;同时中方投资算力基础设施,本质上相当于绑定了所在国的数字IT基础设施与人工智能产业的算力底座。

·国内主流算力租赁模式:国内算力获取与租赁模式因参与主体、使用场景不同存在明显差异,具体如下:

a. 不同类型企业的算力获取方式:国内算力行业参与主体多元,不同区域、类型的市场均有对应运作模式,除西部地区、算力节点城市、数据中心企业、云厂商的特色模式外,还有部分非算力行业资金方仅因行业热度入场投资,不具备实际运营能力。资金充足的头部企业(含云厂商、头部AI大模型训练企业、头部AI应用企业)自持算力卡以英伟达卡为主,自持部分主要用于自身模型训练;资金有限的创业型独角兽企业80%以上算力需求依靠租赁满足,自身不持有算力卡;对外提供算力服务的企业100%通过租入算力满足需求,通常先签署万卡集群类长期租赁协议,按3年或5年摊销获取较低采购成本,再以零售方式转售给下游用户。

b. 头部互联网厂商的合规采购方式:以BAT为代表的头部互联网厂商自持的英伟达卡通常对外宣称是在美国禁售政策出台前采购的,实际上美国针对H800等中国特供型算力卡的禁售政策仅预留不到半年的采购窗口,无法满足大厂大规模采购需求,部分卡到货时已处于禁售期。因此大厂对外提供大规模算力服务时,不会直接使用自持的受监管卡,而是通过与自身存在一定关联但无强绑定关系的影子公司采购算力再对外提供服务,从法律层面规避美方关于H100、H200等高端算力卡的使用监管。

c. 头部存量厂商的布局差异:字节、阿里是国内英伟达卡存量规模最大的两家厂商。去年之前字节的算力重资产布局重点在东南亚,国内占比远低于东南亚,今年开始重点布局国内;阿里的算力重资产同时布局东南亚与国内,国内占比相对东南亚更高。

3、企业算力部署选择平衡点

·算力部署方式选择逻辑:企业算力部署方式的选择可从两大核心维度判断:

a. 算力核心用途:若算力主要用于对外提供服务或经营,优先选择公有云租赁方式,其核心优势并非性价比更高,而是更有利于业务的快速发展与扩容。对外提供服务的企业需要超前建设算力,若处于创业初期现金流不足,一旦算力建设跟不上用户、内容、存储的爆发式增长节奏,易出现服务器宕机、业务中断或拥塞问题,可能导致前期三年积累的用户在1-2周内全部流失。以小红书为例,其业务爆发式增长阶段,自建算力完全无法匹配扩张需求,使用云服务可灵活支撑发展,但当业务体量发展到较大规模后,云服务的成本会显著高于自建算力平台;若算力主要用于内部研发、内部生产等非对外场景,选择自建算力(自行采购设备、租赁机房、调度算力)的性价比更高。

b. 成本分界标准:年度IT服务(包含云服务、算力服务)成本以3000万为分界点,3000万以内选用云服务性价比合理,超过3000万选择自建算力更划算。

4、AI服务器残值与硬件需求变化

·NV服务器残值与二手市场:a. 价格方面,2024年采购的H100服务器当前市场回收价为170-180万,当时市场售价为250-280万,售价较高源于货物经多层中转(美国→新加坡→印尼→香港→国内),每层中转均会增加成本,当前回收价相当于英伟达出厂价的八折至八五折。

b. 残值预期方面,此前行业对NV服务器三年残值预估差异明显:保守企业预估为20%-30%,仅偏激进或专业的算力投资服务商敢预估为40%,市场普遍参考CPU服务器三年残值约15%的水平,认为NV服务器贬值速度更快;但当前二手设备厂商真实回收行情显示,NV服务器三年实际残值可达50%-60%,远高于此前行业预期。

c. 二手市场流通性方面,当前算力租赁市场火爆,H系列、B系列GPU卡稀缺,有卡即可快速出租,回收方因有充足饱和算力订单支撑,愿意高价回收服务器,持有方预判持有GPU卡租赁收益可观因此惜售,导致二手AI服务器市场流通性较差。

·配套硬件需求变化逻辑:a. GPU服务器硬件配置趋势方面,当前GPU服务器单机组卡数持续提升,原行业标配为8卡,目前英伟达已推出16卡服务器,国产厂商已落地32卡GPU服务器产品。

b. 配套硬件需求增长逻辑方面,GPU卡数提升会抬高卡间互联带宽要求,进而带动光模块、光纤光缆等配套硬件消耗量同步增长,该需求增长与传统或新型服务器分类无直接关联,核心驱动为算力需求持续提升。

c. 数据中心提升算力密度的驱动因素方面,数据中心企业土地、能耗指标均有上限,无法无限制扩张,因此普遍倾向于在有限空间及能耗指标内提升单机柜算力密度:原单机柜功率为12千瓦,仅可放置1台服务器,应用液冷技术后单机柜功率可达120千瓦,42U标准机柜内可塞入64卡,单位空间算力承载量大幅提升,可创造更高运营收益,这一趋势也进一步放大了配套硬件需求规模。

5、算力租赁行业盈利水平分析

·行业盈利水平与影响因素:以H100算力设备为例,按260万元采购价、6.5万元市场月租金测算,考虑较低资金成本时此前较好的回本周期为3.5-4年,资金成本更高则3年无法回本。算力项目盈利受折旧方式、政府补贴、资金成本多重因素影响,多数企业会将3年合同的设备按5年折旧(少数按6年),叠加政府补贴与超低息贷款时净利率表现较好。其中头部项目如阿里H100、H800项目,按5年折旧、3年合同测算,净利率可达10%-15%,对应毛利为20%-25%。政府补贴是否纳入盈利测算各企业规则不同,项目制测算通常会将补贴计入,当前政府补贴整体退坡,但算力租金同步上涨,两者平衡下行业利润率仍处较好水平。当前终端算力租金已较此前上涨10%,但受中间商截流影响,算力资产持有方实际拿到的租金涨幅最高仅约5%,因此净利率增幅仅为2%-3%,与终端租金上涨幅度不匹配。具体来看,H100设备合理月租金应为8万元左右,终端用户实际出价可达8万-9.1万元,但算力持有方实际仅能拿到6.5万-7万元/月,中间利润差额被中间商截留,目前至少2/3的算力供给方与终端用户之间存在较高的中间商壁垒,若无中间商衔接,商业投资方也难以直接对接终端客户。

·行业补贴模式与客户结构:当前国内算力补贴呈现区域差异化特征,一线城市对非国产算力项目已全面停止补贴,即便存在补贴也不以算力补贴名义发放,此前曾按算力项目投资规模的一定比例给予补贴的政策已取消,仅国产算力项目可享受补贴,补贴多以固定投资补贴形式发放且整体呈退坡趋势。全国范围内合理的政府补贴比例区间为10%-15%,最高可达到30%,宣称50%补贴的情况无法落地。西部地区补贴形式并非现金,而是采用资源置换模式,例如新疆地区要求算力投资达到1000个单位起,对应给予一定兆瓦数的风电指标,风电指标可被有风电投资需求的企业收购用于建设陆地风电厂。算力采购需求高度集中,核心采购方仅为10家左右的头部大模型、互联网厂商,包括阿里、腾讯、字节、智谱、MiniMax、月之暗面、阶跃星辰、百度、华为、小红书、B站等,需求集中在布局大模型业务的互联网厂商群体中。

6、国产GPU租赁市场现状与前景

·国产GPU租赁市场现状:当前国产GPU在租赁市场的推广核心由政策强制驱动,具体驱动逻辑如下:

a. 企业若要获取政府各类政策支持,无论支持事项是否与算力相关,均需将国产算力的使用比例作为评审核心附加条件,未达使用要求的主体无法通过评审、获得相应支持;

b. 企业申请数据中心能耗指标时,必须配套相应比例的国产算力,未完成配置的申请将不予批复,若不配合适配国产算力,后续区域算力资源布局审批会面临障碍,进而在行业竞争中失去算力规模优势,难以满足模型训练、数据存储等业务需求。

当前国产GPU租赁市场的主要应用场景及现存问题包括:

a. 部分对外宣传的千卡、万卡级国产算力集群项目多为关联交易,仅在财报层面体现营收与利润,未产生实际商业价值;

b. 科研机构普遍采用“两条腿走路”的适配策略,需按时交付、产出成果的核心项目仍使用N卡,仅非核心、可拉长研发周期用时间换结果的项目才响应政策号召适配国产卡。

·国产GPU发展前景与挑战:能够真实落地适配国产卡的企业,除需具备充足的资金实力外,还需拥有较强的技术研发能力,其中头部互联网企业、大模型独角兽的融资事项绑定了国产卡使用要求,未达到约定使用比例的主体无法获得对应融资。政策强制推动国产GPU普及的逻辑具备合理性,唯有通过强制使用倒逼产品迭代,才能推动国产品牌逐步符合商用市场价值要求。

从发展前景来看,当前国产算力的性能正在持续提升,商业合同签订规模、算力建设规模也处于持续增长态势,现阶段国产GPU的实际使用效果并非核心考量,优先实现商业层面的流通才能为后续产品优化、性价比提升提供基础,预计2年内国产GPU有望抢占1/3的国内算力市场,实现阶段性发展突破。

从落地挑战来看,当前企业主动适配国产GPU的意愿普遍较低,核心制约因素为适配成本高企:适配国产GPU所需的研发人力成本是适配N卡的2-3倍,原本适配N卡仅需月薪一两万元的研发人员即可完成的工作,适配国产卡需聘请月薪四五万元的高端技术人员完成算法调优工作,会显著增加企业的经营负担,若无政策强制要求,企业普遍因嫌麻烦、投入产出比低而不愿主动适配国产卡。

7、主流算力产品价格与供需展望

·主流NV卡租赁与采购价格:当前国内市场存量主流NV卡型号包括A100、A800、H100、H800、H200,其中H800为中国特供版,国内存量规模约一万卡,属于相对小众型号;B200、B300发布时间较短,国内到货量极少,暂未成为主流产品。租赁价格方面,A100与A800租赁价格相近,约4万元/月/台;H100、H800、H200的租赁价格随租期有所差异,签订1年合约的长租价格为7-7.5万元/月/台,租期不超过3个月或半年的短租价格为8-9万元/月/台。B200因供给量极低,目前暂无公开零售租金订单,主要面向有万卡集群建设需求的大厂,租赁价格约12-13万元/月/台,其采购价格差异较大,香港拿货价约380万/台,国内采购价可达460-470万/台,当前国内企业每月到货量仅五六台,远无法满足万卡集群建设需求。采购价格方面,H100与H200采购价相近,约为210-220万元/台,但当前市场少有H100、H200的采购需求,有算力投入计划的客户基本都在等待B200、B300到货,市场以消化国内现有存货为主。NV卡普遍按3-5年折旧,此前算力租赁合约普遍签订3年,因市场预期3年后卡的性能会显著落后,当前主流合约已调整为签订5年,主要是客户希望锁定长期算力供给,避免后续算力不足。

·算力租赁成本构成:算力租赁的核心成本中,折旧是最大的成本项,除此之外设备维修、备机成本也是重要组成部分。算力租赁厂商仅需承担硬件故障维修责任,模型训练、软件调试等相关工作由用户自行负责。针对大规模集群客户,厂商需要配置备机以保障服务稳定性,千卡集群最低需要配置3-5台备机,最高需要配置8-10台备机,备机为全新未使用设备,出现硬件故障时立刻替换使用,故障设备由厂商自行返厂维修,不备足备机则无法达成合作,这部分备机投入会直接影响厂商收益。当前租赁报价已包含电费、机房托管费,电力成本占算力租赁总成本的比例为10%-15%。传统CPU服务器时代,CPU服务器投入与机房投入比例约为1:1,云厂商对电力成本敏感度极高;而GPU服务器投入是机房投入的8-10倍,大幅压缩了基础设施及电力成本的占比,因此企业对电价的敏感度显著下降,不再将低电价作为选址的第一优先级,更看重集群规模与地理位置,核心城区可支撑100兆瓦以上的大型数据中心更受青睐,仅规模为10-20兆瓦、无法支撑万卡集群的小型数据中心会考虑选址在电价更低的偏远区域。

·供需缺口与长期价格展望:当前NV卡进口呈结构化限制,仅特殊机构、涉及涉密战略研发项目的重点企业可获批进口NV卡,商用领域普通中小企业基本无法进口NV卡。当前算力供需缺口本质是政策调节的结果:此前美国禁售NV卡时,国内海关全面放行甚至通过官方渠道协助引进设备,当前美国放开NV卡销售后,国内通过海关管控限制NV卡进口量,仅向特定主体开放进口资质,核心目的是通过制造供给缺口,倒逼商用领域企业适配国产GPU,优先解决算力“有没有”的问题,为国产GPU产业提供发展窗口,这一扶持逻辑与此前新能源汽车产业补贴逻辑一致,预计半年到1年即可清晰分辨国产GPU厂商的市场竞争力。长期来看算力租赁价格必然下行,核心驱动因素包括两点:一是当前算力成本仍处较高水平,大量中小AI应用企业无法承担大规模算力租赁费用,部分应用甚至会通过限制普通免费用户的使用权限来控制成本,企业端降本需求强烈;二是国产GPU厂商正在重点攻关互联互通的算力服务生态,未来将以token为单位对外提供标准化算力服务,进一步压低算力供给成本。当前头部AI应用企业可通过自有特权渠道保障算力供给以维持用户体验,中小AI应用企业若缺乏资源扶持,要么接受头部云厂商的绑定条件,要么面临被收编、场景被扼杀的局面。

Q&A

Q: 请介绍今年以来国内外算力租赁行业的发展情况。

A: 今年以来,头部互联网厂商在AI算力领域的投入显著加速,同比增幅明显。核心驱动力来自AI应用对Token消耗的爆发式增长,以及中小企业全面转向利用AI工具优化工作流程。企业决策从观望转为明确:资金充裕者自购GPU设备,其余企业直接租赁云服务。同时,国内头部互联网厂商GPU算力基础设施单体项目规模较去年同期扩大2至3倍。

Q: 请说明今年以来算力租赁价格的具体涨幅及合同模式变化。

A: 以英伟达H100为例,三年前签订的三年期锁定租赁合同月租金约为6.5万至7万元。当前合约到期后,议价模式发生根本转变:不再按原投资比例分成,而是依据市场供需大幅涨价,且租赁方更倾向短租,优先将算力提供给出价更高的客户,长租优先级下降。

Q: 如何看待未来两年算力租赁价格的延续性及供给端变化?

A: 短期至中期涨价趋势难以逆转,核心原因在于算力供给侧严重不足。当前主流应用场景仍高度依赖英伟达GPU,而受地缘政治影响供给受限;国产GPU短期内难以实现商业化大规模替代,仅能在政策引导或强制要求下于零星行业试点应用。中小创业公司作为算力消耗主力,因工作流深度绑定英伟达生态,缺乏尝试国产方案的主动性与耐心。

Q: 云服务厂商近期涨价的策略逻辑及后续是否会持续?

A: 云厂商涨价本质是商务策略:利用算力资源紧张,将GPU服务作为杠杆,对中等体量用户提高云服务价格以优先保障其算力需求;对头部客户则维持优惠以留存。全面涨价不现实,实际成交价与官网标价存在差异。此外,工信部指导要求行业避免无序内卷,政策层面推动价格理性回归。

Q: 国内外算力租赁商业模式存在哪些主要差异?

A: 海外市场由头部企业主导,非行业企业极少参与算力资产运营或倒卖;国内模式多元:西部地区、算力节点城市、数据中心企业、云厂商及部分资本驱动型主体均参与。中东等一带一路国家多采用中方投资换当地资源模式,中方主导方案设计与算力底座建设。

Q: 国内算力租赁主流合约模式有哪些?

A: 头部AI企业自持英伟达卡用于涉密模型训练,对外服务部分通过影子公司采购市场算力以规避监管;创业型独角兽企业80%以上依赖租赁;对外提供AI服务的企业100%采用租赁模式,通常以万卡集群长协低价采购后零售分发。字节重资产布局侧重东南亚,阿里国内与海外并重,2024年字节加速国内算力投入。

Q: 企业选择公有云租赁或自建算力中心的决策平衡点是什么?

A: 决策核心取决于算力用途与年成本规模:若算力主要用于对外提供服务或业务扩容,云租赁更利于敏捷发展;若用于内部研发或工作流优化,自建更经济。年IT服务成本3000万元为关键分界点——低于此阈值云服务性价比合理,超过则自建更具成本优势。

Q: 前期采购的英伟达AI服务器当前残值水平及经营回报如何?

A: 以H100为例,2024年采购设备当前二手回收价达170万至180万元,残值率约50%至60%,显著高于此前行业预估的40%。因算力租赁需求旺盛、订单饱和,二手厂商愿以高价回收,持有方亦倾向保留资产而非出售。

Q: 国内AI服务器二手市场流通性现状如何?

A: 流通性并未改善,反而因设备涨价及租赁需求旺盛,持有方普遍不愿出售。此前企业对三年残值预估保守,现因实际回收价提升及稳定租赁收益,残值预期上调,进一步抑制二手交易活跃度。

Q: CPO涨价对传统服务器及算力基础设施的影响机制是什么?

A: 影响核心源于单服务器卡数提升,卡间互联带宽需求激增带动光模块消耗量上升。数据中心为提升单位面积算力密度,在有限土地与能耗指标下追求更高算力产出,间接推高光模块与光纤配套需求,与传统服务器迭代关联度较低。

Q: 当前国内算力租赁业务的净利率水平及影响因素有哪些?

A: 以H100/H800项目为例,按5年折旧、3年合同测算,净利率约10%至15%,毛利率20%至25%。关键变量包括:设备残值率、政府补贴、资金成本及中间商分润。终端用户支付租金与算力持有方实收价存在显著剪刀差,约2/3项目受中间商壁垒影响,净利润增幅远低于市场租金涨幅。

Q: 算力租赁价格上浮是否存在客户可接受的上限?

A: 价格演进仍由供需主导,但市场呈现两极分化:一类企业专注服务头部互联网客户,需雄厚资金实力,盈利较稳定;另一类深耕区域中小企业、教育机构或特定行业,通过聚合零散需求实现微利运营。国资背景企业凭借低成本资金,以盘活存量、获取微利为目标。

Q: 国产GPU在商业租赁市场的现状、政策驱动及发展前景如何?

A: 当前国产卡应用主要受政策强制驱动:政府将国产算力配比作为数据中心能耗指标审批、科研项目评审及融资支持的附加条件。真实商用意愿较低,因中小企业适配成本高、工作流迁移复杂。但商业流通规模持续提升,政府通过构建千卡/万卡集群、引导科研机构两条腿走路推动生态建设。预计两年内有望抢占约1/3市场份额,核心取决于国产芯片能否在商用性价比与生态成熟度上实现突破。

Q: 国内主流英伟达GPU型号的租赁价格及成本结构如何?

A: 主流型号中,A100/A800月租金约4万元;H100/H800/H200整租约7万至7.5万元,短租达8万至9万元;B200因国内存量极少、单台采购价380万至470万元,月租金预估12万至13万元,但实际交付缓慢。成本结构上,电力成本占算力租赁总成本约10%至15%;设备维修与备机为重要运维成本;当前新签集群合同普遍采用5年期,以规避未来算力短缺风险。

Q: 当前算力供需缺口的主要成因及弥补路径是什么?

A: 缺口本质由政策调控形成:美国对华禁售放松后,中国海关实施选择性准入,仅特殊机构或涉密项目可获英伟达卡进口许可,商用渠道基本阻断。此举旨在倒逼企业适配国产算力。弥补路径依赖国产GPU生态成熟度提升,包括推动芯片互联互通、降低Token服务成本,长期看租金将因竞争与成本优化而回落。

Q: 2024年英伟达H100等高端卡的实际进口情况如何?

A: 商用领域基本无新增进口,仅特殊背景机构可获准入。政府通过限制进口强化国产替代紧迫性,为国产GPU企业提供窗口期;企业竞争力将在半年至一年内经市场检验。

Q: 国产GPU能力提升将对算力租赁行业产生何种影响?

A: 长期看,随着国产GPU生态完善,算力租赁价格将逐步下行。当前高租金抑制中小企业大规模应用,企业核心诉求是降本。国产方案若能实现百万Token成本显著低于现状,将推动行业从溢价阶段回归理性定价,促进AI应用层创新与普及。

如下知识星球,每日实时更新(调研纪要、会议录音)等实时资讯。年度5万篇以上,赶快扫码加入。