从“囤卡”到“提效”：商汤大装置的算力突围逻辑|商汤|算力|算法

文 | 刘芬编辑 | 蒋诗舟

日前，商汤科技发布的2025年财报，一个数字引发关注：下半年年息税折旧摊销前利润（EBITDA）上市后首次转正，达3.8亿元。

对于AI公司来说，EBITDA转正的意义不止于财务本身。它通常被视为运营改善的拐点——公司从技术投入期进入价值兑现期，烧钱换增长的阶段正在过去，精细化运营带来的自我造血能力开始显现。2025年，商汤科技全年总收入增长33%，超50亿元，为近三年最快增幅；下半年经营性现金流自上市以来首次实现正向净流入

这份成绩单背后，是商汤科技“大装置-模型-应用”的“三位一体”战略的逐步验证。早在2020年，当行业还在争论要不要做算力基础设施时，商汤科技已经开始投入建设。如今，这套体系正在将算力效率转化为可验证的商业模式。

整个AI行业正在经历一场算力焦虑。“养龙虾”爆火，直接带动Token消耗指数级增长，AI公司如何接招，无疑是行业当下热门话题。

来自国家数据局的数据显示，到今年3月，中国日均Token调用量突破140万亿，两年增长超千倍。相比去年底，三个月提升40%以上。调用量猛增，背后是AI应用从“对话”到“做事”带来的算力需求革命。

一般而言，Token是大模型处理信息的最小单元，计算量越大，消耗Token越多。在早期问答模式下，一轮对话消耗几百到几千Token，一旦用户停止提问，消耗也就随之停止。进入Agent模式后，人工智能开始在后台持续执行多步骤任务。这一趋势下，Agent使用Token，Token拉动刚性算力需求。有业内人士测算，单Agent消耗约为对话模式的4倍，多Agent系统高达15倍。华泰证券研究所报告也指出，Token调用量随推理扩展呈倍数增长，AI算力需求随Token增长呈更大倍数增长。

IDC预测，到2030年全球活跃AI智能体将达22.16亿，年度Token消耗量有望从2025年的0.0005 Peta Tokens激增至15.2万Peta Tokens。

随着AI应用加速落地，由Token需求爆发引起的算力紧缺，正加速一个早已开始的趋势：算力竞争的重心，从“谁拥有最多的芯片”转向“谁能把每一颗芯片、每一度电、每一个Token的效率发挥到极致”。谁能把推理成本降下来、把算力效率提上去，谁就能掌控AI产业的话语权。

不乏业内人士指出，当前算效低下普遍存在，部分智算中心GPU利用率偏低，加剧资源浪费与结构失衡。未来需完善算力利用率、任务效率、单位能耗产出等效能指标，引导产业进入精细化效率竞争。只有通过更精细的调度、资源池化与弹性部署，才能将有限算力用到极致。

一、短期够用，长期紧缺：算力市场的结构性矛盾

算力正在从一个技术问题，变成一个经济问题。当下的市场格局呈现出清晰的结构性矛盾：短期够用，长期紧缺。

据了解，算力体系分为通用算力、智能算力、超级算力等，其中智能算力与AI关系最密切。中国算力体系以智算为主导，占比超9成。

中国市场上，目前在大规模采购智能算力的主力军是大型科技公司、电信运营商、各地方城市及央国企。华创证券首席经济学家张瑜表示，对于地方政府，从“东数西算”中的8个样本省市看，2026年规划算力总规模同比增速达44%，仍能维持高双位数增长。对于科技巨头，阿里巴巴相关投资计划或继续加码，腾讯、字节也在持续跟进。对于三大运营商，今年算力投资支出基本持平去年。

其中，中国电信2025年资本开支804亿元，其算力基础设施投资人民币202亿元，占比约为25%。中国联通全年资本开支542亿元，并在财报里明确提出2026年资本开支预计在500亿元左右，其中算力投资占比将超过35%。

这不仅是运营商算力建设从“通用服务器堆叠”向“高性能超节点架构”的战略转型，更是一个明确信号：算力正转变为全社会的基础设施。各地方城市及央国企正在成为重要的算力投资方，政府牵头设立专项资金，地方央国企发布招投标公告，第三方企业参与建设智算中心，算力采购正从“试点”走向“规模化”。

短期来看，供给端并不短缺。2025年中国智能算力同比增长119%至1590 EFLOPS，超出市场预期。IDC预期，2026-2028年，中国智算还将维持约40%的年均增速。但国际对比看，中国智算仍有很大增长空间。截至去年一季度，美国智算全球占比达到75%，中国占比约为15%。

长期缺口正在加速形成。国金证券直言，2026年是中国算力需求从“云端训练”向“训练+推理”双轮驱动的关键之年，算力缺口将在更多模态和更广场景的催化下，极速释放。

华泰证券提供了一个更深层的观察：模型能力提升正从“数据-算力-算法”的线性关系，转向以“数据生成与利用效率”为核心的非线性增长。这意味着，每一次模型能力的跃迁，都带来远超以往的算力消耗。

供给端的结构性矛盾，在需求洪峰面前被急剧放大。传导至终端，是价格的上涨。

2026年初，亚马逊AWS率先将EC2机器学习容量块服务价格上调约15%，谷歌云随后上调全球数据传输服务价格，北美地区费率翻倍。3月，阿里云、百度智能云、腾讯云密集发布调价公告，头部厂商主流GPU算力实例涨幅集中在15%-34%区间。涨价公告的核心原因高度一致：全球AI需求爆发，算力需求持续攀升，核心硬件供应链成本显著上涨。

这不是简单的市场行为。在业内人士看来，它标志着行业竞争逻辑的根本转向，从“低价换规模”的粗放时代，进入“价值定输赢”的精细化运营阶段。此次调价将倒逼中小开发者转向性价比更高的国产算力平台，优化算力使用效率，淘汰低价值、高算力消耗的无效项目，行业资源将进一步向具备核心技术、清晰盈利模式的优质企业汇聚。

一位AI创业公司CEO道出了行业普遍焦虑：“以前我们讨论算力，说的是‘够不够用’。现在我们讨论算力，说的是‘用不用得起’。很多创业公司也开始算账，分析哪些应用值得跑，哪些场景需要砍。

有观点指出，当算力从“战略资源”变成“财务成本”，行业的游戏规则就被改写了。那些仅仅依靠“囤卡”优势的玩家，可能很快就会发现自己的护城河正在消失。而真正能够在效率上拉开差距的玩家，才有机会在下一轮竞争中胜出。

二、商汤大装置：用效率重构算力竞争逻辑

在算力焦虑蔓延的行业中，商汤科技提供了一种差异化的解题思路。对比来看，商汤大装置不是“囤卡人”，而是通过算电协同、软硬协同，提升算力效率的精细化运营者。

作为战略底座，商汤大装置实现了从技术长板向产业闭环的深度跃迁。通过底层算力与算法研发的深度联调，大装置全年支撑模型研发任务近百万项。在弗若斯特沙利文发布的《2025年H1中国全栈AI云服务市场报告》中，商汤大装置稳居中国全栈AI云服务市场前四，原生AI云厂商首位。在《2025年中国AI基础设施市场报告》中，商汤科技入选“领导者象限”，跻身第一梯队。

权威认证也在持续加码。2026年2月，获评工信部“软件供应链安全能力评估”优秀级认证；2026年1月，获中国信通院业界首个“5A卓越级”认证；2025年8月，IDC报告在“性能优化”、“大模型训推”等核心维度均给满分。

其中，商汤大装置的核心竞争力，在于“最懂大模型”的定位。这种“算力-模型-应用”的“三位一体”战略的深度耦合，构成了坚实的技术护城河。以LightX2V世界模型推理系统为例，依托步数蒸馏与极致量化等前沿技术，商汤不仅率先实现物理世界模拟的实时视频生成，更在制程受限的国产硬件上实现对海外顶尖芯片性能的反超。该系统获阿里、腾讯等多家头部厂商官方推荐，开源模型在HuggingFace累计下载破千万，稳居全球前十。

在国产化方面，商汤走得务实而坚决。联合华为昇腾、海光、寒武纪等十余家芯片厂商发布“商汤大装置算力Mall”，率先完成与昇腾384超节点的全面适配。国产世界模型“开悟2.0”已实现在国产算力集群上的全流程训练，成为首个在国产芯片生态上实时生成动态场景的世界模型。

更长远来看，商汤正在探索算力效率的终极命题——算电协同。在宁德时代支持下，商汤打造了全球首个实现“算力管理-IDC运营-储能系统”全链路打通的AI智能系统，通过大模型精准预测电力负载，动态生成最优能源调度策略。联合达卯科技、溥泉资本发布临港AIDC算电协同平台，通过“算随电用”、“电随算动”的双向闭环，实现算力与能源的精准匹配。这一实践为大规模智算中心的低碳运营提供了可复制的样板。

对AI初创企业而言，推理时代的算力困局本质是四重难题。其一，Agent带来的Token消耗呈指数级增长，且从“阶段性投入”变为“持续性支出”，推理成本无疑成为财务黑洞。其二，全球GPU供应链紧张，有限算力优先倾斜战略合作伙，初创公司即便愿付溢价也难得算力；其三，缺人缺经验导致GPU用不“满”。其四，供给弹性不足，推理负载的峰谷波动又让固定配置陷入两难。

为解决这些难题，商汤科技通过弹性扩缩容机制，支持按需自动调配算力，低峰期缩减、高峰期秒级扩容，让算力成本与业务规模精准同步。在供给端，商汤已与20余款国产芯片完成适配，率先实现万卡国产GPU集群异构混训，算力利用率达80%、效率达同构训练的95%，打破单一GPU供给限制。在服务端，商汤将十余年AI实战经验整合为“4S”全周期赋能——从联合解决方案到联合销售，从专家服务到战略协同，帮助初创企业一次性打通“用得起、拿得到、用得好”的算力难题。

三、商业化新赛点，商汤剑指“性价比”和“功效比”

“那个只要‘堆算力’就能赢的时代，已经结束了。”2025年11月，OpenAI前首席科学家Ilya Sutskever的这句话，正在成为行业共识。2026 GTC大会上，黄仁勋表达了同样的观点：AI竞赛不再是比拼原始算力，而是效率与商业化。

大模型技术的同质化竞争日益加剧。当模型能力本身不再是决定性差异，真正的比拼就转移到了模型之外，谁能以更低的成本、更高的稳定性，支撑海量Token的持续流转。

中国信通院将这一转变概括为：大模型已进入“2.0时代”，核心标志是强化学习的广泛应用。整体算力需求结构正从训练侧向推理侧倾斜，IDC预测到2027年推理负载将达到70%。为高并发、低延迟推理设计的算力效率，变得前所未有的重要。

有业内人士表示，算力就像中国电网，未来比拼的不是有没有算力，而是能不能稳定、低成本产出Token。其判断是，在Token工厂时代，算力的终极价值是普惠与高效。AI产业正从技术驱动转向商业驱动，未来算力部署将形成集中式公共算力与分布式私域算力并存的格局，MaaS平台将成为连接训练与推理的关键载体。

这一判断正在被市场验证。当算力成为一种公共服务，能否跑出算力服务的巨头，在于是否有企业将软硬协同发挥到极致。商汤建设大装置的逻辑正是如此，这种“算力-模型-应用”“三位一体”战略的深度耦合，构成了最坚实的技术护城河。

商业化的成果也在验证这一逻辑。据了解，商汤大装置已成为国内多家头部科研机构、互联网科技巨头、顶尖泛娱乐企业、具身智能机器人企业以及第一梯队大模型独角兽的核心伙伴。同时，商汤参与上海市规资局“量子城市”项目，助力五粮液、中铁第一勘察设计院等领军企业实现行业大模型部署。

除支撑外部商业循环，商汤在大装置与大模型技术基础之上的应用也实现了商业化多点开花。2025年，商汤的AI原生应用已深入泛办公、金融、智能营销、内容创作、泛智能终端等多个领域。商汤与值得买科技达成深度战略合作，让电商营销实现了智能化：帮助其店铺运营效率提升20倍、直播运营效率提升6倍、流量投放效率提升5倍、实时监控效率提升3倍。

同时，在“1+X”战略下，商汤的X创新业务也基于集团的硬核技术与市场经验，在智能驾驶、家用AI机器人、智慧医疗、智慧零售、具身智能等更复杂的场景构建商汤AI生态矩阵。财报显示，2025年商汤X业务的收入超3亿元。

此外，商汤将于今年二季度推出基于第二代NEO架构的全新基础模型，在业内率先验证原生多模态架构下理解与生成深度统一的新“尺度定律”，预计将实现效能与性价比的倍数级跃升。依托“三位一体”战略协同优势，商汤将持续降低推理成本，让极致性价比成为最坚实的竞争壁垒。

商业的终极理性，不是烧掉多少燃料，而是走了多远的路。算力这道难题的解法，不在于拥有多少芯片，而在于如何让每一颗芯片、每一度电、每一个Token，都产生最大价值。

当AI产业从技术驱动转向商业驱动，当Token成为衡量价值的新标尺，那些能够率先构建效率壁垒的公司，才有机会在下一轮竞争中胜出。商汤，正在试图成为那个在“Token工厂”时代定义行业标准的人。