年入7亿亏47亿，市值4000亿：智谱财报错位背后|智谱财报|第三季度财报|算力|调用量

对于独立厂商而言，最大的挑战不是亏损本身，而是在互联网大厂的生态包围中，能否守住独立厂商的“那张牌桌”。

文｜北野

年入7亿，亏掉47亿。这是一家市值4000亿港元的大模型企业，上市后交出的首份年度成绩单。

3月31日，“全球大模型第一股”智谱AI发布的最新财报显示：2025年公司总收入7.24亿元，同比增长131.9%；年内亏损47.18亿元，同比扩大59.5%；经调整年内净亏损31.82亿元，同比扩大29.1%。

营收翻倍，亏损扩大。表面上看，这与多数尚处于“烧钱换规模”阶段的公司并无两样。但出人意料的是，这张每股亏掉12元的业绩单发布次日，智谱股价却大涨超30%，市值一度突破4000亿港元。

近年来，受技术热潮推动，大模型行业快速跃升成为全球科技焦点，随着头部企业从“跑模型”迈入“跑营收”阶段，商业化变现也成为产业升级面临的新挑战。作为今年率先敲开资本市场大门的先行者，智谱的这份财报，犹如抛出的一枚硬币，折射出赛道的光明与阴影，为市场提供了一个重新审视大模型行业的窗口。

大模型到底是不是一门好生意？而在一众大厂的生态包围下，智谱能否守住独立厂商的“那张牌桌”？

硬币的正反面

拆解智谱的2025年财报，大可分为“增长”和“亏损”正反面。

首先是增长面。7.24亿元的全年收入，较2024年的3.12亿元增长131.9%，虽不及市场此前较为乐观的预期，但已延续了接连三年翻倍的态势。尤其在去年下半年，其收入约5.33亿元，远超上半年的1.91亿元，加速迹象明显。

尽管7.24亿元的营收对照4000亿港元的市值看起来不值一提，但对于刚跨过“跑模型”阶段的赛道而言，实现连续的营收翻倍增长并非易事。相较于抗压能力强、业务多元化的大厂，以技术起家的独立模型创业公司，必须以更具辨识度的策略实现这一增长路径。

智谱起步于2019年，早期以针对不同客户需求定制开发的本地化部署业务为主，直到2021年开始布局MaaS，开启了云端部署业务的商业化探索。MaaS即标准化API服务，其核心是通过将大模型能力封装为标准接口，开发者或企业按需调用付费，与OpenAI与Anthropic的变现逻辑类似。

过去一年，智谱的开放平台及API收入从2024年的0.48亿元增长至1.9亿元，同比增长292%，占比从2024年的15.5%提升至26.3%，毛利率从3.3%跃升至18.9%。而本地化部署收入5.34亿元，同比增长102.3%，占总收入比重73.7%，毛利率从66%降至48.8%。

不难看出，尽管仍是智谱营收的大头，但本地定制化服务的“成本陷阱”已直观体现，云端业务增速明显高于前者，正逐渐成为真正的增长引擎。智谱CEO张鹏在业绩说明会上透露，2026年一季度API调用价格上调83%后，调用量反增长了400%。

“量价齐升”现象或是智谱打动资本市场股价“越亏越涨”的根本原因之一。但需要冷静看待的是，这一现象建立在当前市场仍处于供不应求阶段，客户对价格的敏感度被旺盛需求覆盖，持续性有待观望。

再来看财报不容忽视的亏损面。

与平台型企业“烧钱”营销换规模不同的是，科技企业的钱主要“烧”在研发投入上。2025年智谱研发开支31.8亿元，同比增长44.9%，是总收入的4.4倍。研发费用增加的主要原因是两方面：员工成本增加和算力采购费用增加。截至2025年末，智谱拥有1094名正式员工，产生总薪酬成本（含股份支付）13.63亿元。

从研发费用率来看，已从2024年的7.0倍收窄至4.4倍，但即便如此，投入产出比依然触目惊心，意味着智谱当下的规模化盈利模式难以覆盖巨额成本。而受本地部署业务拖累，2025年智谱整体毛利率41.0%，较2024年下降15.3个百分点。造血能力仍待验证。

卖模型转向卖Token

2026年，AI行业的核心关键词为Token（词元）。国际市场调研机构沙利文2月发布的报告显示：自2025年下半年起，中国企业级大模型日均调用量飙升至37.0万亿tokens，较上半年的10.2万亿增长263%。

作为大语言模型处理信息的基本单位，数以亿计的Token每天正通过网络流通于世界各地，犹如AI时代的“石油”和货币，重塑着行业的底层商业逻辑。随着AI的任务执行模式从人机对话升级为机器自循环，Token消耗量呈指数级增长，头部玩家的商业模式从“烧钱”跑模型、比参数转向构建Token经济体系。

今年初，OpenClaw（龙虾）的爆火，为Token消耗需求的增长再添了一把火。

智谱正是吃到这波红利的企业之一。其今年一季度的业绩增长，主要得益于3月推出的Claw Plan，一键部署龙虾——上线两天订阅用户破10万，上线20天突破40万。彼时，恰逢智谱新一代GLM-5模型刚发布一个多月，其先后两次上调API价格，正好踩中龙虾需求爆发的节点。这也促成了智谱API调用定价大涨83%后，GLM模型调用量反增长400%的惊艳表现。

对于智谱而言，2026年的关键词同样是Token。其首次提出了其通向AGI的商业逻辑：AGI商业价值=智能上界×Token消耗规模。“智能上界”指模型能力的领先程度，决定技术的话语权；“Token消耗规模”即调用量的增长指数，决定商业价值的体量。

这一公式几乎为接下来的大模型竞赛提供了一个可参照的新标准。过去两年，大模型竞争的核心叙事是模型能力：参数规模、推理深度、复杂任务完成率，构成行业主要竞争指标。但随着各家模型的逐渐跑通与成熟，模型能力的差异化空间或将日益缩小，因此Token消耗规模或将成为玩家集中发力的新赛点。

然而，“卖Token”是不是门好生意，如今下结论还为时过早。由Token消耗狂潮引发的全球算力缺口，正日益变大转化成压力。今年3月以来，算力供给端全面收紧，不止智谱一家在涨价，阿里、百度、腾讯等大厂集体抬高了算力价格。

扩建AI算力基础设施的资本开支动辄数百亿量级，这与目前多数企业AI业务的“微薄”收入形成鲜明对比，“卖Token”的收入增速远赶不上建数据中心的“烧钱”速度。不过，于资金链雄厚的大厂而言，亦可变相看做是其抗压能力延展的优势，但对于智谱这些独立厂商来说，如实是压在胸口的巨石。

真正的命门

眼下，智谱的最大挑战不是亏损本身，而是在阿里云、字节跳动等大厂的生态包围中，能否守住独立厂商的“那张牌桌”。

今年2月，智谱GLM-5上线时，因用户访问量远超预期，导致服务器负载激增，出现限流、卡顿、排队等问题。尽管采用高峰期3倍、非高峰期2倍的分层消耗策略，但服务器扩容跟不上，仍影响了大量付费用户的用户体验。

随后，智谱带着诚意满满的补偿方案公开致歉，但道歉后的首个交易日，其股价暴跌23%，半天蒸发超700亿港元。可见，一次算力“断供”就能让市场用脚投票，同时也暴露出独立厂商相较大厂在基础设施上的脆弱性与短板。

与海内外拥有自建算力中心的巨头不同，智谱的算力一直依赖第三方供应。2025年起，智谱从租赁GPU设备转向算力采购模式，意味着边际成本不会随规模扩大而有效摊薄，而这部分费用计入研发成本，直接导致研发成本数字进一步被放大。

从行业竞争格局来看，国内大模型市场的第一梯队仍当属拥有全栈自研能力，同时又掌握着算力资源和云服务渠道的互联网巨头。2025年下半年，大模型日均tokens消耗TOP3分别为：千问（32.1%）、豆包（21.3%）和DeepSeek（18.4%）。

以市场份额第一的阿里云为例，企业可以通过API，从阿里云上直接调用千问大模型，享用MaaS服务。而最新开源的Qwen3.5-Plus的API价格仅为Gemini 3的1/18，每百万tokens低至0.8元。

3月，阿里刚宣布成立新的事业群，建立以“创造Token、输送Token、应用Token”为核心目标的新组织，全面迎战AI时代。不难看出，无论是资金、资源支持，还是声量、生态维度，都远非独立厂商所能比肩。

而以智谱、MiniMax、月之暗面等为代表的第二梯队玩家，自然深谙这一点。因此选择了一条以基础模型研发为核心，主要通过API服务和私有化部署实现商业化的路径，在技术上形成了差异化优势。

对于大厂的生态包围，张鹏表示并不畏惧，在他看来，大厂一定会自研，但不一定在所有场景中都能做到有足够的竞争力，这由资源限制所决定。

尽管如此，智谱仍在降低对单一大客户的依赖。财报显示，2024 年其第一大客户收入占比达 19%，2025 年无任何一个客户收入占比超过 10%。财报披露，中国前十大互联网公司中有9家深度调用GLM模型。但这些互联网巨头基本都在不断加码自有模型的厚度，智谱唯有持续保持技术快速迭代、模型能力等优势，方有立足之本。

对于已经登陆资本市场的智谱而言，最危险的信号已不是亏损，而是当算力、客户、资本都开始向大厂集中时，发现已经没有了上桌的筹码。