为什么Token消耗两年涨1800倍,赢家却不是造出最强模型的那家?

2026年第一季度的这个数字,让硅谷很多人没睡好觉:中国大模型Token日均调用量首次超越美国。但真正的震动点在于——不是靠用户数量,而是靠单个用户的消耗量爆炸。一个部署了OpenClaw实例的用户,每天烧掉的Token相当于几百个普通聊天用户。国家数据局的曲线近乎垂直:从2024年初约1000亿,到2025年中30万亿,再到2026年2月180万亿。

打开网易新闻 查看精彩图片

两年1800倍。最后那段最陡峭的爬坡,来自一场叫"龙虾热"的现象。

更值得追问的是:为什么是中国,在Agent浪潮里率先完成大规模商业落地?明明在OpenClaw出现前,中国AI还在"追赶"而非"并跑"的位置。

Anthropic的一个决定,把开发者推向了中国模型

OpenClaw的全球扩散几乎是同步的。但美国和中国对这场爆炸的承接方式,走出了两条完全不同的路线。分叉点来自Anthropic和谷歌的一个商业决策。

Anthropic很快算清了一笔账:一个每月付49美元Claude Max订阅费的用户,如果用OpenClaw跑一个7×24小时的自主Agent实例,消耗的算力可能相当于几百个普通对话用户一个月的总量。订阅制定价,在Agent时代根本维持不了盈利。

于是Anthropic宣布:通过个人订阅账号的OAuth令牌接入第三方工具,属于违规行为,发现即封号,无缓冲期。谷歌内部甚至直接屏蔽了员工访问OpenClaw。

这个决定从商业逻辑上完全合理,却产生了一个Anthropic自己可能没充分预料的连锁反应:数以百万计正在寻找稳定、低成本Agent后端的开发者,被直接推向了中国模型。

「用国产模型还是用Claude跑OpenClaw」从此不再是技术选择,而是风险管理决策。Anthropic随时可能封号,ChatGPT的API在高频调用下成本高昂,而MiniMax M2.5、DeepSeek V3.2、Qwen等国产模型不仅通过官方API明确支持Agent高频调用,价格更是只有Claude Sonnet的十分之一到二十分之一。

在OpenRouter这个全球开发者聚合平台上,这个选择被几百万次地做出。最终呈现为那个历史性榜单:前五名调用量最高的模型,中国占了四席。

这种逆转不是因为中国模型突然比Claude更强,而是因为Agent时代的竞争维度变了。

对话式AI时代,模型质量上限决定一切;Agent时代,成本、稳定性、对高频调用的支持程度,跑到了质量前面。这个维度的切换,恰好落在中国AI的优势区间。

明略科技副总裁李梦林说得很准确:「OpenClaw的'自带代理'模式,本质上触发了AI产业链的一次利益再分配。」分配的结果是,一部分原本流向海外大厂的API收入,在2026年第一季度发生了历史上第一次大规模的逆转性迁移。

阿里成立ATH事业群:Token是AI时代的基础能源

2026年3月,阿里做了一个现在回头看极为清醒的组织架构调整。

成立Alibaba Token Hub(ATH)事业群,与电商、云智能并列,由CEO吴泳铭直接带队。整个事业群围绕一件事运转:创造Token、输送Token、应用Token。

这句话像绕口令,背后却是一个极为清晰的产业判断:Token正在成为AI时代的基础能源,就像电力之于工业时代,带宽之于互联网时代。

在这个判断下,大模型不再是终点,而是产能设施;云服务不再是存储和计算的租赁,而是Token的输配网络;应用产品不再是对话框,而是Token的消费终端。整条产业链的价值,最终收敛到一个核心指标:单位Token的成本和质量。

这正是中国AI在过去两年一直在做、却被严重低估的事情。

DeepSeek用557万美元训练出GPT-4级别的模型,不是技术炫耀,是在给Token工厂降低原料成本。MiniMax M2.5把Agent工具调用能力压缩到10B激活参数高效推理,定价"每小时1美元",是以几乎是成本价的方式抢占基础设施层市场份额。Qwen系列则在多模态与工具调用的兼容性上持续打磨,确保在OpenClaw生态里能成为开发者的默认选项之一。

三条路线指向同一个目标:在Agent时代的Token消耗链条里,占据成本最低、供应最稳的位置。

这条逻辑链在OpenClaw爆发前,是被少数人相信但很难被大众感知的故事。OpenClaw的到来,把它从"产业洞察"变成了"当下现实"——因为OpenClaw是一台真实的、高功率运转的Token消费机器,它第一次让无数普通用户亲身感受到"AI持续运转"和"Token持续消耗"之间的直接关系。

谁能以最低的成本稳定供给Token,谁就成为这台机器的首选燃料。

另一个不太被注意的数据同样印证了这个判断。MiniMax M2.5发布后12小时内登顶OpenRouter热度榜,一周内周调用量暴涨至3.07万亿Token,超过DeepSeek V3.2、GLM-5等三家模型的总和。这个数字背后的驱动力,几乎全部来自OpenClaw生态的高频调用需求。

中国AI的商业化主战场,已经从"有多少人打开了这个App",跳转到了"有多少Token在这套基础设施上流动"。

两个指标描述的是完全不同的商业逻辑:前者依赖用户粘性和消费习惯,后者依赖基础设施的规模效应和成本护城河。后者,才是真正难以被颠覆的竞争优势。

腾讯阿里字节百度的"跟风",藏着同一套底层逻辑

腾讯、阿里、字节、百度在OpenClaw热潮里的集体涌入,表面看像跟风,但解剖每家的动作逻辑,会发现背后藏着比"跟风"深得多的战略。

腾讯在深圳总部举办线下安装会,帮数百名用户把OpenClaw部署到TencentCloud上。官方文档写得清楚:"OpenClaw来自开源社区,云应用不收费。"然后补了一句:"云服务器和API按实际消耗计费。"

翻译过来:用OpenClaw的入口流量,喂饱腾讯云的算力和带宽业务。OpenClaw本身是免费的诱饵,基础设施才是腾讯真正要卖的东西。

阿里的逻辑更赤裸。用户在轻量应用服务器上部署OpenClaw后,系统默认配置DeepSeek API,但会自动引导用户前往"阿里云百炼大模型控制台"创建API Key,通义千问系列模型的调用费用从那个API Key里出。用户以为自己在用开源工具,但每一次Agent的工具调用,都在给阿里云的计量系统加计数。

百度直接上线"移动版OpenClaw",主打无需本地部署、云端环境隔离更安全,本质是把OpenClaw做成了接入百度云算力的消费入口。

字节跳动的ArkClaw连本地部署的麻烦都省掉,做成纯浏览器端产品,换取的是ByteDance火山引擎在每一次Agent运行背后的调用份额。

四家的算盘高度一致:OpenClaw是流量入口,云基础设施和Token供给才是利润池。这不是应用层的竞争,是基础设施层的卡位战。

这场竞争里有一句话在开发者社区流传:"在中国跑OpenClaw,模型成本是美国的十分之一,封号风险是美国的零分之一。"这个性价比公式,正在重塑全球AI开发的地理分布。

但故事还有另一面。当中国模型在OpenRouter榜单上占据四席时,一个微妙的问题浮现:这些调用量有多少来自海外开发者,有多少来自国内?

OpenRouter的数据不区分地域,但行业内的共识是,海外开发者占比显著。这意味着中国模型的"胜利",某种程度上是在承接被美国大厂政策驱逐出来的需求。这种胜利是结构性的,还是周期性的?

更深一层的问题是:当Agent的复杂度继续提升,对模型推理能力的要求突破当前国产模型的能力边界时,成本优势还能否维持?

MiniMax M2.5的10B激活参数设计,本质上是在能力和成本之间做 trade-off(权衡)。当前OpenClaw生态的Agent任务,大多停留在信息检索、代码生成、简单工具调用层面。一旦Agent需要处理多步复杂推理、长程记忆维护、动态环境适应,模型能力的权重可能重新上升。

竞争维度的切换不是单向的。Agent时代早期,成本和稳定性优先;但Agent能力的天花板,最终仍由模型质量决定。

中国AI的当前优势,建立在一个特定时间窗口内:海外大厂因商业模型冲突而主动收缩,国产模型恰好完成了成本结构的优化,OpenClaw提供了一个高并发的需求场景。三个条件叠加,造就了2026年第一季度的历史性逆转。

但这个时间窗口会开放多久?Anthropic和谷歌会不会推出针对Agent时代的新的定价模型?OpenAI的API策略会不会调整?这些变量都可能改变当前的竞争格局。

更根本的问题是:Token消耗量的超越,是否等同于AI产业竞争力的超越?

180万亿日均Token是一个惊人的数字,但它描述的是基础设施层的流量规模,而非应用层的价值创造。就像带宽消耗量不等于互联网公司的市值,电力消耗量不等于工业国的制造业水平,Token消耗量本身是一个中间指标,而非最终指标。

真正的考验在于:这些Token消耗,有多少转化为了可量化的生产力提升、可规模化的商业模式、可持续的用户付费意愿?

OpenClaw生态目前呈现出的繁荣,很大程度上是开发者驱动的——技术人员在探索新工具的可能性,企业客户在试点自动化流程。但从试点到规模化部署,从免费试用到持续付费,中间隔着漫长的验证周期。

中国AI在这场Agent浪潮中的领先,本质上是基础设施供给能力的领先。但AI产业的终局,不是比谁卖的Token多,而是比谁用Token创造的价值大。

阿里ATH事业群的成立,吴泳铭亲自带队,说明顶层已经意识到这个区别。创造、输送、应用Token的三位一体,是在试图打通从基础设施到价值创造的完整链条。但这个链条的最后一环——应用层的价值捕获——目前仍是最薄弱的环节。

对比美国,Agent领域的明星创业公司正在涌现:垂直领域的自动化工具、企业级工作流平台、个人生产力助手,各有明确的商业化路径。中国这边,OpenClaw的热度集中在技术社区和云厂商的基础设施层,应用层的创新相对沉寂。

这可能是因为中国AI的发展路径历来偏重基础设施——从电商时代的云计算,到移动互联网时代的支付与物流,再到AI时代的模型与算力。应用层的创新需要更灵活的组织形态、更宽松的监管环境、更成熟的付费习惯,这些条件的积累需要时间。

也可能是因为Agent的应用层创新,恰恰需要与具体行业知识深度结合,而中国各行业的数字化程度参差不齐,Agent的落地场景比美国更为碎片化。

无论如何,2026年第一季度的Token数据,标记了一个重要的转折点:中国AI在全球竞争中的位置,从"追赶者"变成了"并跑者",甚至在特定维度上成为"领跑者"。但这个位置能否巩固,取决于能否完成从"Token工厂"到"价值创造者"的跃迁。

OpenClaw的爆发是一个意外变量,它放大了中国AI在成本和稳定性上的优势,也暴露了中国AI在模型能力上限上的相对短板。当海外大厂调整策略、当Agent任务复杂度升级、当开发者从"尝鲜"走向"生产环境部署",竞争的天平可能再次摆动。

当前的优势是真实的,但优势的结构是脆弱的。它建立在特定政策窗口、特定技术阶段、特定需求场景的三重叠加之上。任何一个变量的变化,都可能重塑格局。

中国AI的参与者们显然意识到了这一点。DeepSeek的持续迭代、MiniMax的多模态扩展、Qwen的生态建设、ATH事业群的组织架构调整,都是在为下一阶段的能力竞争做准备。成本优势是入场券,能力上限才是护城河。

Agent时代的竞争,刚刚进入中场。前半场的胜负手是基础设施的规模和成本,后半场的关键可能是模型能力的突破、应用价值的验证、以及全球开发者生态的心智占领。

180万亿Token是一个里程碑,但不是一个终点。它记录的是中国AI在特定竞争维度上的成功,也暗示了下一阶段需要补足的短板。

当Token消耗量的故事讲完之后,下一个故事会是什么?是某个国产模型在推理能力上实现代际跨越,还是某个Agent应用真正跑通了规模化盈利的商业模式,抑或是中国开发者生态在全球开源社区中取得话语权的质变?

这些问题的答案,将决定2026年第一季度的历史性超越,是一个持续趋势的开端,还是一个特定窗口期的偶然。