据全球最大AI模型API聚合平台OpenRouter最新发布的数据显示,截至3月15日,中国AI大模型的周调用量达到4.69万亿Token,连续第二周超越美国,稳居全球第一。
3.9—3.15 日这一周,全球调用量排名前三的均为中国AI大模型:
第一名:MiniMax M2.5,周调用量1.75万亿Token,已连续五周蝉联榜首,但本周调用量环比下滑6%;
第二名:阶跃星辰Step 3.5 Flash (free),周调用量1.34万亿Token,环比大幅增长79%,首次跻身前三;
第三名:DeepSeek V3.2,周调用量1.04万亿Token,环比增长25%。
Token调用量代表了什么?
简单来说,Token调用量越高,意味着AI大模型被用得越多。
Token是模型处理信息的最小计量单位,本质上代表的是:有多少真实的工作负载运行在这些模型上。一次用户的提问,还是一段代码的生成或测试,最终都要被拆解成一个个Token来完成运算。因此,Token调用量是AI大模型活跃度和产业价值的最真实度量。
AI大模型调用Token完成什么任务?
AI大模型的应用任务主要涵盖以下几类:编程开发、角色扮演、技术问题解决与科学研究。此外,它也广泛应用于翻译、金融分析、学术写作等诸多领域。从结构性变化来看,编程类任务(programming)从2025年初占OpenRouter总Token的11%飙升至50%以上,增幅最为显著。
不同任务所对应的大模型推理成本差异显著。其中,编程与角色扮演的使用量极为庞大,同时保持着高度优化的、接近中位数的成本。这表明,无论是专业生产力还是对话式娱乐,都是AI大模型主要且巨大的驱动力。此类任务属于成本敏感性领域,是开源模型已取得显著优势的地方。
近一年来,全球AI大模型的token调用量呈持续上升趋势,OpenClaw等智能体场景是国产模型调用量增长的主要驱动力。任务通常需消耗百万级Token,这使得性价比突出的国产模型更受海外开发者欢迎。而海外模型正加速转向更务实的商业化路径。例如,Gemini借版本升级逐步关停旧版低价访问权限,努力提高营收。
未来,性能、开源与商业化之间的平衡问题,仍是AI大模型发展的核心命题。
编辑 | 杨曦
审核丨秦婷
责编 | 兰银帆
热门跟贴