中国大模型Token调用量稳居全球第一|token|大模型|度量|编程|调用量

中国大模型Token调用量稳居全球第一

清华金融评论

2026-03-24 09:37 ·北京 ·《清华金融评论》商业频道官方网易号

据全球最大AI模型API聚合平台OpenRouter最新发布的数据显示，截至3月15日，中国AI大模型的周调用量达到4.69万亿Token，连续第二周超越美国，稳居全球第一。

3.9—3.15 日这一周，全球调用量排名前三的均为中国AI大模型：
第一名：MiniMax M2.5，周调用量1.75万亿Token，已连续五周蝉联榜首，但本周调用量环比下滑6%；
第二名：阶跃星辰Step 3.5 Flash (free)，周调用量1.34万亿Token，环比大幅增长79%，首次跻身前三；
第三名：DeepSeek V3.2，周调用量1.04万亿Token，环比增长25%。

Token调用量代表了什么?
简单来说，Token调用量越高，意味着AI大模型被用得越多。
Token是模型处理信息的最小计量单位，本质上代表的是：有多少真实的工作负载运行在这些模型上。一次用户的提问，还是一段代码的生成或测试，最终都要被拆解成一个个Token来完成运算。因此，Token调用量是AI大模型活跃度和产业价值的最真实度量。

AI大模型调用Token完成什么任务?
AI大模型的应用任务主要涵盖以下几类：编程开发、角色扮演、技术问题解决与科学研究。此外，它也广泛应用于翻译、金融分析、学术写作等诸多领域。从结构性变化来看，编程类任务（programming）从2025年初占OpenRouter总Token的11%飙升至50%以上，增幅最为显著。

不同任务所对应的大模型推理成本差异显著。其中，编程与角色扮演的使用量极为庞大，同时保持着高度优化的、接近中位数的成本。这表明，无论是专业生产力还是对话式娱乐，都是AI大模型主要且巨大的驱动力。此类任务属于成本敏感性领域，是开源模型已取得显著优势的地方。

近一年来，全球AI大模型的token调用量呈持续上升趋势，OpenClaw等智能体场景是国产模型调用量增长的主要驱动力。任务通常需消耗百万级Token，这使得性价比突出的国产模型更受海外开发者欢迎。而海外模型正加速转向更务实的商业化路径。例如，Gemini借版本升级逐步关停旧版低价访问权限，努力提高营收。

未来，性能、开源与商业化之间的平衡问题，仍是AI大模型发展的核心命题。

编辑 | 杨曦
审核丨秦婷
责编 | 兰银帆