三月份的AI行业,所有人都在谈论同一个词:Token。

国家数据局局长刘烈宏放出一组数字:中国日均Token调用量突破140万亿,两年前这个数字还是1000亿。黄仁勋在GTC大会上更直接——Token将是未来数字世界最核心的大宗商品,它的吞吐量会成为全球CEO紧盯的核心经营指标。

几乎同时,阿里云在财报会上扔出一个激进目标:五年内云与AI商业化年收入破1000亿美元,年复合增长率得跑到47%。火山引擎也公布,豆包大模型日均调用量超100万亿Tokens,挤进全球前三。

云计算终于像门正经生意了。

科技行业判断"好生意"有三条铁律:规模效应压低成本、生态锁定抬高迁移门槛、标准化产品带来高毛利和经常性收入。亚马逊AWS、微软Azure、谷歌Cloud全中——资源池越大越便宜,客户进去就出不来,订阅费源源不断。2025年,三家利润分别为456亿、540亿、139亿美元。

但中国云厂商过去十几年走的是另一条路:重资产、低毛利、高度内卷。政企客户要定制、要本地部署,SaaS生态又弱,最后云计算做成了人力密集型项目制生意,规模效应无从谈起。

AI浪潮给了国内厂商一次商业模式重构的机会——把大模型封装成可调用的标准化云服务,按Token计费卖给企业和开发者。

增长来得很快。2025年Q1,中国云基础设施支出116亿美元,同比增长16%,AI需求已成上云主因。Omdia预测,今年中国AI云市场规模518亿元,同比暴涨148%,2030年破1930亿。

但增长之前是血战。去年5月,火山引擎率先降价,阿里云、百度智能云跟进,大模型Token定价一年内腰斩再腰斩,部分厂商推理算力毛利率跌成负数。逻辑很简单:用亏损换规模,谁先让开发者养成API调用习惯,谁就能卡位。

转折点出现在2026年初。海外AWS、谷歌Cloud宣布涨价,国内阿里云、百度智能云、腾讯云迅速跟进。3月18日,阿里云和百度智能云同步官宣:前者最高涨34%,后者最高涨30%,新价格4月18日生效。

导火索是Token需求炸了。Agent爆发和多模态成熟彻底改写了游戏规则——一次智能体任务包含多轮推理、工具调用、任务执行,Token消耗远高于普通对话。算力需求从"训练为主"变成"训练+推理"双轮驱动,资源瞬间紧缺。

这直接改变了云厂商的计费逻辑。

传统IaaS阶段,云厂商本质是"二房东",出租计算、存储、带宽,同质化严重,只能打价格战。Token计费让云厂商从"卖硬件使用权"变成了"卖智能服务"——用户不关心底层什么GPU,只关心Token能不能解决问题;算力池越大,并发调度效率越高,边际成本越低;标准化API一旦形成调用习惯,迁移成本极高。

云厂商也在把紧缺算力向高附加值Token业务倾斜。腾讯云推出"龙虾"产品矩阵,把MaaS平台升级为TokenHub,推出统一Token Plan。智能体让按次调用变成高频自动化服务,Token流水暴涨,MaaS收入有望占到云厂商总收入的30%甚至更高。

这正是顶级云生意需要的"经常性、高毛利、可复制"结构。海外四大云厂商转型AI云,国内阿里云、百度智能云、腾讯云、火山引擎、华为云也在强化AI属性,资本开支持续创新高。

AI云的竞争不是拼GPU数量,而是拼全栈成本——谁能做到最低的"单位Token成本"。

美国市场已验证这个逻辑。谷歌全栈整合最深,Gemini用自研TPU训练、部署,芯片-模型-云三位一体,掌握成本与定价权。亚马逊自研Trainium 2芯片超140万枚,性价比比英伟达高30%-40%。反面教材是甲骨文,无自研芯片、完全依赖英伟达、高度绑定OpenAI单一客户,处境最脆弱。

中国厂商面临同样逻辑,叠加地缘压力,维度更复杂。

阿里云有规模与全栈双重优势。百炼MaaS聚合通义千问、DeepSeek等主流模型;累计出货超47万颗AI芯片,60%以上服务外部客户;未来三年投入超3800亿元。

百度智能云不抢Token流量规模,而是向能源、金融、汽车等垂直行业核心流程渗透,凭昆仑芯、文心大模型、千帆平台的"芯-云-模-体"全栈自研,连续两年拿下国内大模型招投标项目数和中标金额双第一。

火山引擎走激进MaaS路线。抖音、视频创作、Seedance等内部庞大应用生态平摊了基础设施成本,让Token定价持续激进。据《晚点》报道,团队已上调2026年MaaS收入目标。

腾讯云完成艰难转型。2022年砍掉低毛利总包业务,聚焦高毛利自研PaaS/SaaS,"被集成"替代"总集成"。短期份额承压,但收入结构改善:2025年IaaS占四成、PaaS四成、SaaS两成,PaaS与SaaS毛利率50%-70%,远高于IaaS的10%-15%。成立12年首次规模化盈利,马化腾将其列为年度核心成就。

AI把云计算的计费单元从同质化算力转向差异化智能服务;Token爆炸让MaaS收入长期看不到天花板;标准化API的规模效应与生态锁定,正在给头部厂商一定的定价权。

这门变好的生意,门槛也极高:千亿级算力投入、自研芯片或深度国产算力整合、自研模型与MaaS工程化能力——模型强弱直接决定单卡Token吞吐量,决定单Token成本,最终决定毛利率。

黄仁勋那句话可以收尾了:生成Token的成本与效率,决定科技企业的营收与生死。