在过去10年,阿里云等国内外云厂商通常以计算、存储、网络、数据库等公共云产品的收入和利润作为考核基础。将Token作为直接收入指标,是近一年最新出现的现象
文|《财经》研究员 吴俊宇
编辑|谢丽容
《财经》多方获悉,截至5月13日,阿里云日均Token收入相比4月初已经增长超过五倍。月收入目前已经达到数亿元级别。
2026年之后,阿里云将Token(词元)收入作为核心经营指标。阿里云今年4月初设定了一个短期Token收入增长目标。具体要求是,到5月15日前,日均Token收入较4月初要增长5倍。也就是说,阿里云要在两个月内完成目标。目前,这个目标已经达成。
《财经》向阿里云方面发出了置评请求,不过阿里云方面未回应上述消息。
5月13日,阿里集团也公布了截至2026财年(2025年4月1日-2026年3月31日)报告。阿里云2026财年营收1581亿元,同比增长28.6%。2026财年四季度,阿里云收入同比增长38%至416.3亿元,外部收入(剔除阿里集团内淘宝、天猫等业务贡献的收入)增速超过40%。其中AI相关产品收入达89.71亿元,占外部收入比重首次突破30%。
由于Token主要通过MaaS(模型服务)平台调用,因此阿里百炼MaaS平台的表现一直受到市场关注。阿里管理层在财报后电话会议披露,包括百炼平台在内的模型和应用年度经常性收入(ARR,通常计算方式为当月收入×12)在快速增长。它在2026财年四季度收入超过80亿元,2027财年一季度有可能超过100亿元,2027财年末将超过300亿元。
《财经》了解到,虽然阿里云目前Token相关收入在总收入大盘占比较低,但阿里云内部认为机会巨大。
因为,中国市场的Token消耗量也在指数级增长。国家数据局3月24日显示,截至2026年3月,中国日均Token调用量已超过140万亿,相比2024年初的1000亿增长了1000多倍。相比2025年底的100万亿,三个月时间增长了40%多。
在过去10年,阿里云等国内外云厂商通常以计算、存储、网络、数据库等公共云产品的收入和利润作为考核基础。将Token作为直接收入指标,是2025年开始出现的现象。
最初将Token收入作为核心经营指标的是字节跳动旗下的火山引擎,阿里云在2025年下半年跟进了这一做法。《财经》了解到,阿里云考核Token收入的同时,会更关注全栈AI的总收入。其中包括AI laaS(基础设施),训练和推理算力收入等。
Agent爆发带动Token收入增长
阿里云等云厂商的Token收入增长,主要来自三方面:一是Agent带来的调用量提升;二是MaaS(模型平台)商业化进展;三是互联网、大模型等公司带来的算力消耗。
2026年初,Agent(智能体)工具爆发,是这轮Token消耗量增长的基础。过去,AI对话工具一次对话消耗的Token数量可能只有几千。但一次Agent任务,可能就会消耗数万,甚至数十万的Token。因为,Agent任务执行过程中,模型需会规划任务、调用工具并记录执行状态,每个步骤都可能触发新的模型调用。
比如,月之暗面、智谱、MiniMax背后的云服务商是阿里云。这几家公司的收入增长,也在同步推动阿里云的Token收入增长。阿里云是最大受益者。
今年2月末,一位月之暗面人士向《财经》证实,月之暗面在2月的20天内,收入就超过了2025年。《财经》了解到,月之暗面截至今年4月的ARR(年度经常性收入,当月收入×12)已超过2亿美元。
智谱CEO(首席执行官)张鹏在2026年3月末的财报业绩会透露,智谱2026年3月模型API(应用接口)的ARR达到17亿元,同比增长60倍。
阿里云自身产品和业务的Token收入增长也很快。一位阿里云人士表示,包括百炼MaaS平台调用、云间产品的AI调用、Qoder AI代码生成工具等都是关键增长点。
阿里云的Token收入增长目标是阿里集团“云+AI”业务增长目标的一部分。
3月19日,在2026财年三季度(2025年四季度,阿里财年为每年4月初-次年3月末)财报电话会议,阿里集团CEO(首席执行官)吴泳铭提出:五年内,“云+AI”外部收入超过1000亿美元/年(约合6900亿元)。
今年3月,阿里云方面向《财经》提供的资料显示,预计未来五年云外部收入年复合增长率超过40%,第五年收入目标为1000亿美元。
按照这一目标,阿里云未来几年营收增速要显著高于历史上任何一家主流云厂商(包括亚马逊AWS、微软Azure、谷歌GCP)的增长水平(报道详见)。
有阿里云相关人士对《财经》表示,这是按照尽可能高的收入目标去制定的。阿里习惯在变革的关键阶段,通过设置高目标的方式倒逼一线调整动作。“取其上者得其中,取其中者得其下”,哪怕最终没完成既定目标,也能倒逼整个组织围绕新目标真正动起来,最终取得一个不错的结果。
Token收入被认为是阿里云未来收入增长的关键一环。吴泳铭当时披露称,过去三个月,阿里云的百炼MaaS平台上的Token消耗规模提升了6倍,预计MaaS收入将会成为阿里云最大的收入产品。不过,吴泳铭并未对这一目标给出明确的时间节点。
《财经》了解到,阿里云目前一线销售的结果管理虽然是看营收/利润,但过程管理已经换成了看Token消耗量。一位阿里云人士对《财经》表示,挖掘到一个新商机后,会把它定义为10亿Token或者100亿Token级别。虽然,目前估算的Token消耗量和客户实际使用消耗量有一定的差异,但Token仍然被认为是引导目标的通用语言。
收入目标确定,还有配套的组织调整。阿里集团在今年3月16日成立了Alibaba Token Hub(ATH)事业群。这是一个以Token为核心目标的组织。
其中包括五个事业部:通义实验室,负责千问基础模型的研发;MaaS(模型平台)业务线,提供模型服务平台;千问事业部,负责千问个人AI助手;悟空事业部,负责钉钉To B的AI原生工作平台;AI创新事业部,探索各类AI创新应用。
ATH事业群各个事业部的组合逻辑是,创造Token、输送Token、应用Token。
Token成为中美云厂的关键指标
国内外云厂商,都在把Token收入作为未来几年的重要增长引擎。
《财经》多方了解到,截至2025年末,全球最大云厂商亚马逊AWS的MaaS平台Bedrock营收为数十亿美元。它在亚马逊AWS当年1287亿美元营收中占比为较低的个位数,但亚马逊AWS管理层对它预期很高。
亚马逊AWS管理层2025年三季度财报电话会议曾披露,要把Bedrock打造成全球最大的推理平台。长远来看,Bedrock收入贡献将与EC2不相上下。不过,该目标未披露具体实现时间(报道详见)。
EC2是亚马逊AWS最核心的计算产品,年营收至少超过400亿美元,在总营收中占比超过30%。按照上述预测,Bedrock未来将成为一个数百亿美元的业务。
亚马逊2026年一季度财报显示,Bedrock的客户支出环比增长170%,并且2026年一季度Token消耗量超过了过去所有季度的总和。
今年4月,亚马逊AWS技术副总裁Mai-Lan Tomsen Bukovec(美兰·汤姆森·布科韦茨)在一场小规模沟通中曾对《财经》表示,推理正在成为一种常态化的应用模式。用户虽然可以选择各种模型,但核心在于如何构建由推理驱动的应用。她表示,这也是Bedrock平台诞生的初衷,让用户不必成为AI专家,任何开发者都能通过API使用推理应用。
谷歌近半年在财报电话会中连续披露Token增长情况。谷歌管理层在2026财年一季度财报电话会表示,谷歌一方模型目前每分钟处理的Token数量超过160亿,高于上季度的100亿。过去12个月中,330家谷歌云客户分别处理了超过1万亿Token。其中35家达到了10万亿Token。
阿里云智能集团资深副总裁、公共云事业部总裁刘伟光2025年12月末在一场小规模沟通中曾对《财经》表示,他认同亚马逊AWS对MaaS收入长期增长的判断。他认为,当模型能力持续增强、Agent逐步成熟,并覆盖大量IT能力有限的长尾企业后,MaaS收入的占比,有可能达到30%甚至更高。但他同时强调,目前行业仍处于早期。
火山引擎(字节跳动旗下云与AI业务)总裁谭待2025年12月在一场小规模群访中则《财经》表示,他同样认同亚马逊AWS对Token收入增长趋势的判断。两年前,代表智能算力的GPU(图形处理器)芯片出货量已经超过CPU(中央处理器)芯片出货量。随着算力整体支出从训练向推理转型,MaaS的重要性正在变得越来越高。
火山引擎目前是阿里云最有力的竞争对手。2025上半年,火山引擎就开始把Token收入作为销售团队核心KPI指标之一,是国内最早采取这一考核方式的厂商。
2026年4月,火山引擎披露,截至2026年3月,豆包大模型日均Token使用量超过120万亿。2025年12月,该数据是63万亿。也就是说,三个月内,豆包大模型日均Token调用量增长了1倍。
《财经》2026年初多方得到的消息是,火山引擎2025年外部业务(剔除字节跳动内部业务)的Token收入远超10亿元。2025年末,火山引擎曾制定2026年Token收入至少翻倍的增长目标。从2026年初Agent爆发的情况来看,火山引擎的Token收入目标还将继续大幅上调。
中国某ICT硬件企业一位资深战略规划人士2025年7月曾对《财经》表示,火山引擎未来可能的Token收入进行了敏感性测试(一种根据商业模型,综合外部市场条件变化进行市场动态分析的方法)。他测试的结果显示,火山引擎Token收入未来1年-2年可能增长至百亿元。
在今天,Token成了很多公司AI转型的“北极星指标”,也成了大部分云厂商的核心销售指标。但是一个现实问题是,Token目前并不能真正完全反映业务价值。
这更多是供给方(即云厂商、模型厂商等)的目标。对需求方(即企业客户)来说,这可能并不能完全代表真实业务价值,也并不一定完全符合他们的现实用云习惯(报道详见《成为“北极星指标”,AI云市场可能忽略了什么?》)。
从企业CIO(首席信息官)、CTO(首席技术官)的视角来看,Token消耗量并不能直接和业务价值挂钩,更多是和算力成本挂钩。
一位中国大型企业集团数字化部门技术人士2025年12月曾对《财经》表示,他们最关注的,不是模型调用消耗了多少Token,而是Token带来了多少算力成本。因为今天Token成本难以预测,不像过去是买断制、订阅制软件相对固定。
一位亚马逊AWS中国区人士今年4月对《财经》表示,Token收入很重要。但目前的实际情况是,GPU算力资源供不应求。大型企业在大规模生产环节中,为确保算力供应和获得价格折扣,通常倾向在云上提前按月/年租赁并锁定GPU资源,而不是直接通过MaaS平台调用Token。目前,MaaS还是更适合算力需求波动较大的前沿开发者和创新企业。
如果为了收入增长,单纯引导客户Token增长,只会带来更高的算力成本(报道详见《Token正在被浪费》)。在当下竞争环境中,Token收入占比代表了一家云厂商的AI转型进程。但Token不能完全代表客户的业务价值。片面追求Token收入增长,可能会损害企业客户的业务价值。
责编 | 李煜
热门跟贴