打开网易新闻 查看精彩图片

对于独立厂商而言,最大的挑战不是亏损本身,而是在互联网大厂的生态包围中,能否守住独立厂商的“那张牌桌”。

文|北野

年入7亿,亏掉47亿。这是一家市值4000亿港元的大模型企业,上市后交出的首份年度成绩单。

3月31日,“全球大模型第一股”智谱AI发布的最新财报显示:2025年公司总收入7.24亿元,同比增长131.9%;年内亏损47.18亿元,同比扩大59.5%;经调整年内净亏损31.82亿元,同比扩大29.1%。

营收翻倍,亏损扩大。表面上看,这与多数尚处于“烧钱换规模”阶段的公司并无两样。但出人意料的是,这张每股亏掉12元的业绩单发布次日,智谱股价却大涨超30%,市值一度突破4000亿港元。

近年来,受技术热潮推动,大模型行业快速跃升成为全球科技焦点,随着头部企业从“跑模型”迈入“跑营收”阶段,商业化变现也成为产业升级面临的新挑战。作为今年率先敲开资本市场大门的先行者,智谱的这份财报,犹如抛出的一枚硬币,折射出赛道的光明与阴影,为市场提供了一个重新审视大模型行业的窗口。

大模型到底是不是一门好生意?而在一众大厂的生态包围下,智谱能否守住独立厂商的“那张牌桌”?

硬币的正反面

拆解智谱的2025年财报,大可分为“增长”和“亏损”正反面。

首先是增长面。7.24亿元的全年收入,较2024年的3.12亿元增长131.9%,虽不及市场此前较为乐观的预期,但已延续了接连三年翻倍的态势。尤其在去年下半年,其收入约5.33亿元,远超上半年的1.91亿元,加速迹象明显。

尽管7.24亿元的营收对照4000亿港元的市值看起来不值一提,但对于刚跨过“跑模型”阶段的赛道而言,实现连续的营收翻倍增长并非易事。相较于抗压能力强、业务多元化的大厂,以技术起家的独立模型创业公司,必须以更具辨识度的策略实现这一增长路径。

智谱起步于2019年,早期以针对不同客户需求定制开发的本地化部署业务为主,直到2021年开始布局MaaS,开启了云端部署业务的商业化探索。MaaS即标准化API服务,其核心是通过将大模型能力封装为标准接口,开发者或企业按需调用付费,与OpenAI与Anthropic的变现逻辑类似。

过去一年,智谱的开放平台及API收入从2024年的0.48亿元增长至1.9亿元,同比增长292%,占比从2024年的15.5%提升至26.3%,毛利率从3.3%跃升至18.9%。而本地化部署收入5.34亿元,同比增长102.3%,占总收入比重73.7%,毛利率从66%降至48.8%。

不难看出,尽管仍是智谱营收的大头,但本地定制化服务的“成本陷阱”已直观体现,云端业务增速明显高于前者,正逐渐成为真正的增长引擎。智谱CEO张鹏在业绩说明会上透露,2026年一季度API调用价格上调83%后,调用量反增长了400%。

“量价齐升”现象或是智谱打动资本市场股价“越亏越涨”的根本原因之一。但需要冷静看待的是,这一现象建立在当前市场仍处于供不应求阶段,客户对价格的敏感度被旺盛需求覆盖,持续性有待观望。

再来看财报不容忽视的亏损面。

与平台型企业“烧钱”营销换规模不同的是,科技企业的钱主要“烧”在研发投入上。2025年智谱研发开支31.8亿元,同比增长44.9%,是总收入的4.4倍。研发费用增加的主要原因是两方面:员工成本增加和算力采购费用增加。截至2025年末,智谱拥有1094名正式员工,产生总薪酬成本(含股份支付)13.63亿元。

从研发费用率来看,已从2024年的7.0倍收窄至4.4倍,但即便如此,投入产出比依然触目惊心,意味着智谱当下的规模化盈利模式难以覆盖巨额成本。而受本地部署业务拖累,2025年智谱整体毛利率41.0%,较2024年下降15.3个百分点。造血能力仍待验证。

卖模型转向卖Token

2026年,AI行业的核心关键词为Token(词元)。国际市场调研机构沙利文2月发布的报告显示:自2025年下半年起,中国企业级大模型日均调用量飙升至37.0万亿tokens,较上半年的10.2万亿增长263%。

作为大语言模型处理信息的基本单位,数以亿计的Token每天正通过网络流通于世界各地,犹如AI时代的“石油”和货币,重塑着行业的底层商业逻辑。随着AI的任务执行模式从人机对话升级为机器自循环,Token消耗量呈指数级增长,头部玩家的商业模式从“烧钱”跑模型、比参数转向构建Token经济体系。

今年初,OpenClaw(龙虾)的爆火,为Token消耗需求的增长再添了一把火。

智谱正是吃到这波红利的企业之一。其今年一季度的业绩增长,主要得益于3月推出的Claw Plan,一键部署龙虾——上线两天订阅用户破10万,上线20天突破40万。彼时,恰逢智谱新一代GLM-5模型刚发布一个多月,其先后两次上调API价格,正好踩中龙虾需求爆发的节点。这也促成了智谱API调用定价大涨83%后,GLM模型调用量反增长400%的惊艳表现。

对于智谱而言,2026年的关键词同样是Token。其首次提出了其通向AGI的商业逻辑:AGI商业价值=智能上界×Token消耗规模。“智能上界”指模型能力的领先程度,决定技术的话语权;“Token消耗规模”即调用量的增长指数,决定商业价值的体量。

这一公式几乎为接下来的大模型竞赛提供了一个可参照的新标准。过去两年,大模型竞争的核心叙事是模型能力:参数规模、推理深度、复杂任务完成率,构成行业主要竞争指标。但随着各家模型的逐渐跑通与成熟,模型能力的差异化空间或将日益缩小,因此Token消耗规模或将成为玩家集中发力的新赛点。

然而,“卖Token”是不是门好生意,如今下结论还为时过早。由Token消耗狂潮引发的全球算力缺口,正日益变大转化成压力。今年3月以来,算力供给端全面收紧,不止智谱一家在涨价,阿里、百度、腾讯等大厂集体抬高了算力价格。

扩建AI算力基础设施的资本开支动辄数百亿量级,这与目前多数企业AI业务的“微薄”收入形成鲜明对比,“卖Token”的收入增速远赶不上建数据中心的“烧钱”速度。不过,于资金链雄厚的大厂而言,亦可变相看做是其抗压能力延展的优势,但对于智谱这些独立厂商来说,如实是压在胸口的巨石。

真正的命门

眼下,智谱的最大挑战不是亏损本身,而是在阿里云、字节跳动等大厂的生态包围中,能否守住独立厂商的“那张牌桌”。

今年2月,智谱GLM-5上线时,因用户访问量远超预期,导致服务器负载激增,出现限流、卡顿、排队等问题。尽管采用高峰期3倍、非高峰期2倍的分层消耗策略,但服务器扩容跟不上,仍影响了大量付费用户的用户体验。

随后,智谱带着诚意满满的补偿方案公开致歉,但道歉后的首个交易日,其股价暴跌23%,半天蒸发超700亿港元。可见,一次算力“断供”就能让市场用脚投票,同时也暴露出独立厂商相较大厂在基础设施上的脆弱性与短板。

与海内外拥有自建算力中心的巨头不同,智谱的算力一直依赖第三方供应。2025年起,智谱从租赁GPU设备转向算力采购模式,意味着边际成本不会随规模扩大而有效摊薄,而这部分费用计入研发成本,直接导致研发成本数字进一步被放大。

从行业竞争格局来看,国内大模型市场的第一梯队仍当属拥有全栈自研能力,同时又掌握着算力资源和云服务渠道的互联网巨头。2025年下半年,大模型日均tokens消耗TOP3分别为:千问(32.1%)、豆包(21.3%)和DeepSeek(18.4%)。

以市场份额第一的阿里云为例,企业可以通过API,从阿里云上直接调用千问大模型,享用MaaS服务。而最新开源的Qwen3.5-Plus的API价格仅为Gemini 3的1/18,每百万tokens低至0.8元。

3月,阿里刚宣布成立新的事业群,建立以“创造Token、输送Token、应用Token”为核心目标的新组织,全面迎战AI时代。不难看出,无论是资金、资源支持,还是声量、生态维度,都远非独立厂商所能比肩。

而以智谱、MiniMax、月之暗面等为代表的第二梯队玩家,自然深谙这一点。因此选择了一条以基础模型研发为核心,主要通过API服务和私有化部署实现商业化的路径,在技术上形成了差异化优势。

对于大厂的生态包围,张鹏表示并不畏惧,在他看来,大厂一定会自研,但不一定在所有场景中都能做到有足够的竞争力,这由资源限制所决定。

尽管如此,智谱仍在降低对单一大客户的依赖。财报显示,2024 年其第一大客户收入占比达 19%,2025 年无任何一个客户收入占比超过 10%。财报披露,中国前十大互联网公司中有9家深度调用GLM模型。但这些互联网巨头基本都在不断加码自有模型的厚度,智谱唯有持续保持技术快速迭代、模型能力等优势,方有立足之本。

对于已经登陆资本市场的智谱而言,最危险的信号已不是亏损,而是当算力、客户、资本都开始向大厂集中时,发现已经没有了上桌的筹码。