打开网易新闻 查看精彩图片

©️新博弈

文丨 桨声

根据全球知名大模型API调用平台OpenRouter最新数据,3月30日至4月5日,中国AI大模型周调用量达12.96万亿Token,环比暴涨31.48%,连续五周超越美国。同期美国调用量仅3.03万亿Token,不及中国的四分之一。

这个数字意味着什么?平均每天有近2万亿Token的“智能”从中国模型流向全球开发者,相当于每天“吞吐”掉一个维基百科全部内容的好几倍。

打开网易新闻 查看精彩图片

图片来源:OpenRouter 官网

调用量前六的模型清一色来自中国——阿里的千问(占据第一和第三)、小米的MiMo、阶跃星辰、DeepSeek、MiniMax。有意思的是,支撑这些数据的“主力军”并非中国开发者:OpenRouter平台美国用户占47%,中国仅占6%。硅谷的程序员、欧洲的创业公司、东南亚的企业主,正在用真金白银给中国AI投票。

这场“逆袭”快得令人措手不及。其底层逻辑并非单纯的技术超越或价格战优势,那么,真正的原因究竟是什么?

电费单,一张底牌

先说一个让硅谷睡不着觉的事实:训练和运行AI模型,正在成为21世纪最耗电的工程之一。

英伟达创始人兼CEO黄仁勋在3月的一篇博客中,将AI产业拆解成五个层面:能源、芯片、基础设施、模型、应用。他特别强调:“能源是AI的第一性原理,也是系统能产生多少智能的根本约束。”

这话翻译成大白话就是:你想让AI变聪明,先问问电网答不答应。

而美国电网,最近有点“答不上来”了。

AI的算力膨胀正剧烈冲击美国电力系统。2026年初,微软因西弗吉尼亚州的数据中心电网接入延迟,被迫自建燃气轮机;谷歌则斥巨资签下核电合同,为AI“喂电”。

然而,并非所有成本都能由企业自身消化。在美国中西部多州,这场竞赛已开始推高民生电价,部分公用事业公司已申请新一轮涨价。AI竞赛的代价,正从科技巨头的财报,转移到美国普通家庭的账单上。

与此同时,中国的情况几乎是另一个故事。

根据国家能源局2026年1月公布的数据,2025年中国全社会用电量约10.37万亿千瓦时,超过美国的两倍,高于欧盟、俄罗斯、印度、日本的总和。

这个数字背后,是全球最大的电力基础设施和具有竞争力的电价水平。中国西部绿电(风电、光伏)的成本可以压到0.2元/度左右,工业用电整体成本低于欧美多数地区。

更关键的不是电价本身,而是“东数西算”工程带来的结构性优势。中国将数据中心直接建在西部绿电富集区,便宜的清洁能源就地转化为算力,再通过光纤输送到全国乃至全球。

这套模式实现了“电力不出境、价值已跨境”的商业闭环。西部的风,点亮了东部的屏幕,也支撑起了全球开发者的AI应用。

这套“电费优势”直接体现在了API价格上。

以OpenRouter平台为例:美国Claude Opus 4.6模型的输入价格为5美元/百万Token,输出价格高达25美元/百万Token;而中国MiniMax M2.5的输入价格仅为0.3美元/百万Token,输出价格低于2.5美元/百万Token。

同样是写代码的任务,用中国模型的成本只有美国竞品的十分之一。

一名硅谷开发者在社交媒体上算过账:他的团队每月调用约50亿Token,如果用美国模型,月账单约2500美元;切换到中国模型后,这个数字降到了200美元出头。

这就是调用量数据的底层逻辑。不是中国AI突然比美国AI“聪明”了,而是中国AI突然比美国AI“便宜”了一个数量级。

当便宜了一个数量级,“足够好用”就赢了“最好”。这不是国产情怀,是商业理性。全球开发者,正在用脚投票。

算得更巧,练得更实

传统大模型的问题在于:每次推理都要调动全部参数,无论问题是简单还是复杂。好比公司无论开什么会,都叫上所有人,效率自然低了。

包括DeepSeek在内,中国主流大模型普遍采用MoE(混合专家)架构,就像给庞大的“公司”配了一套门禁系统:它只让最相关的几位“专家”进场处理问题,其余继续待命。

打开网易新闻 查看精彩图片

图片来源:千问官网

这套“按需激活”的模式,让模型在保持庞大知识储备的同时,将实际计算量压缩到原来的几分之一。

以阿里千问为例,其MoE架构使得推理成本大幅降低,这也是千问敢推出“免费版”,并仍能维持商业可持续的核心原因。

但这还不是全部。中国AI的另一张底牌,在制造业的车间里。

如果说美国AI的“练兵场”是硅谷的实验室和华尔街的交易大厅,那么中国AI的“练兵场”则是全球最完整的工业产业链。

从精密电子制造到重型机械,从供应链管理到质量检测,每一个环节都孕育着真实、迫切且高价值的AI落地需求。这些需求不是实验室里的模拟场景,而是关乎企业生存的硬指标。

当AI技术被投入到这些真实环境中,它必须直面数据噪音、极端工况和成本控制的挑战。这种严苛的“实战”反而倒逼技术快速迭代。

更重要的是,工业场景产生的海量、多维、高质量数据,是训练和优化AI模型的宝贵燃料。

2026年3月,达摩院发布了一款名为玄铁C950的RISC-V架构CPU,首次在单颗CPU上跑通了DeepSeek V3 671B全量大模型推理,Qwen3 30B可达80 tokens/秒。

这是RISC-V阵营第一次真正进入顶级AI算力的“朋友圈”。玄铁的故事揭示了一个更深的趋势:当AI推理需求爆发、当物理AI(具身智能、机器人)成为新战场,定制化、低功耗、可扩展的芯片架构正在获得历史性机遇。

这套“从能源到芯片到模型到应用”的系统能力,最终凝结成Token的极致性价比。它不是某一项技术的单点突破,而是一个系统工程的胜利。

赢了吗?还早

数字漂亮,就是赢了吗?几个不容忽视的事实,需要先看清楚。

首先,调用量的领先不等于技术实力的全面超越。

打开网易新闻 查看精彩图片

图片来源:欧洲电子行业媒体”eeNews Europe”官网

在核心芯片领域,英伟达最新的Feynman架构GPU(预计2028年推出)单颗功耗将突破5千瓦,性能仍将领先行业一个身位。在基础算法创新上,美国依然保持着原创优势。调用量反映的是市场需求和商业化能力,而非基础研究的全部。

其次,价格战可以赢一时,但赢不了一世。

彭博社、《华尔街日报》分析指出,中国AI模型的海外用户中,相当一部分是冲着“便宜”来的。

这意味着,一旦美国模型的成本下降,比如通过更先进的芯片或更高效的架构,或者中国电价优势被削弱,这部分用户可能会迅速回流。

再者,AI的安全与治理问题正在成为新的竞争维度。

欧盟《AI法案》已经生效,美国各州也在加紧立法。中国AI出海,不仅要面对技术竞争,还要应对日益复杂的监管环境。

该法案要求“高风险”AI系统必须在投放前后进行合规评估,包括对非歧视性与基本权利影响的审查,提供必要的透明度与人类监督机制。

但不可否认的是,这场由“电费单”引发的权力转移,正在改写全球AI产业的游戏规则。

Token正在成为数字时代的新型“大宗商品”。就像石油之于工业时代,算力之于智能时代。而中国,凭借能源成本、基建能力和制造业生态的三重优势,正在成为Token的“世界工厂”。

值得关注的是,这可能是中国第一次在信息技术革命的基础设施层占据先机。

在PC时代,中国是英特尔和微软的“组装车间”;在移动互联网时代,中国是iOS和Android的“应用工厂”;但在AI时代,从能源到芯片到模型到应用,中国正在形成一套相对完整的闭环。

如今,这套闭环的初步成果已经显现。

OpenRouter数据显示,中国模型不仅在调用量上领先,在用户结构上也越来越“全球化”。美国开发者用中国模型写代码,欧洲创业公司用中国模型做产品,东南亚企业用中国模型降本增效。这是中国AI从未有过的全球影响力。

这场竞赛还没结束。高端芯片的瓶颈、品牌认知的短板、行业利润的压力,都是必须正视的挑战。但有一点是确定的:在AI这场“重工业化”的浪潮中,能源是最后的硬约束。

而中国手里,握着最硬的那张牌。剩下的,就看怎么打了。

新博弈(ID:newgametheory)原创

转载请注明来源、作者署名,违者必究

━━ 已入驻平台 ━━

打开网易新闻 查看精彩图片
━━ 视频号 已入驻平台 ━━