杀疯了，DeepSeek 以 3.43 万亿 Token登顶全球大模型调用榜|deepseek|kimi|token|大模型|开源模型|调用榜

AI世界的王座，又换主人。

5月25日，全球开发者公认最中立的大模型聚合平台 OpenRouter更新了榜单。5月18日至24日，中国 AI 企业 DeepSeek 旗下的 V4-Flash 模型，以 3.43 万亿 Token 的周调用量首次登顶全球第一，环比暴涨 66%。OpenAI、谷歌 Gemini、Anthropic Claude，全部被甩在了身后。这不是主场作战的胜利，OpenRouter 的用户 94% 来自海外，中国用户仅占 6%。

更惊人的是整体格局，上周全球大模型总调用量 28.9 万亿 Token，连续五周上涨。中国大模型周调用量 9.223 万亿 Token，环比增长 19.89%；美国仅为 4.93 万亿 Token，环比增长 16.27%。中国已经连续四周领跑全球，且领先优势还在越拉越大。榜单前三，中国包揽前两名。腾讯 Hy3 preview 以 3.07 万亿 Token 紧随其后，Owl Alpha 跻身前五。

DeepSeek 更是杀疯了，前九名里独占三席，旗下模型总调用量 5.74 万亿 Token，连续两周位居全球厂商第一，全面碾压 OpenAI 全系产品。

当中国大模型开始收割全球开发者，最先坐不住的是硅谷的巨头们。

过去十年，全球 AI 行业被一条铁律牢牢绑架 —— 缩放定律。所有人都相信，性能提升只能靠堆参数量、堆算力。这直接催生了一场烧钱军备竞赛，谁能拿到更多英伟达 GPU，谁就能站在行业顶端。但 DeepSeek 用最直接的方式，撕碎了这条铁律。它证明了，性能提升≠单纯堆算力。极致的工程优化，能把同样的算力，发挥出十倍甚至百倍的价值。

最致命的是价格。DeepSeek-V4-Flash 每百万 Token 输入（缓存命中）仅 0.02 元人民币，是 Kimi K2.6 的 1/55、 GPT-5.5 的 1/180；DeepSeek-V4-Flash 每百万 Token 输出价格是 Kimi K2.6 的 1/14、 GPT-5.5 的 1/108。同样的预算，用 DeepSeek 跑一天，用 GPT-5.5 可能只跑 19 分钟。这不是差距，是降维打击。

DeepSeek的登顶，是过去一个月一系列雷霆动作的集中爆发。

一个月两次降价。4月26日，DeepSeek 突然将全系 API 缓存命中价格砍到首发价的十分之一。5月22日，它又扔出一颗重磅炸弹：V4-Pro 模型在 5 月 31 日限时 2.5 折优惠结束后，定价直接锁定为原价的 1/4，永不恢复。

更狠的是，DeepSeek 根本没打算给对手留喘息的机会。

就在降价消息刷屏的同时，媒体曝出了 DeepSeek 的融资计划，700 亿元人民币首轮融资，投前估值可能高达 450 亿美元。这将刷新中国科技初创公司首轮融资的历史纪录。国家人工智能产业投资基金拟领投 100 亿元，腾讯、IDG 资本等确认参投；更有市场消息称，宁德时代已决定参与DeepSeek首轮融资。

最让人敬佩的是，创始人梁文锋个人出资约 200 亿元，牢牢掌握公司控股权。DeepSeek 明确表态，融资所得 70% 全部投入研发，坚持开源路线，短期不追求商业化变现。唯一的目标，就是突破技术边界，实现通用人工智能。

技术上的硬实力，才是 DeepSeek 最硬的底气。V4-Pro 发布直接登顶 Hugging Face 开源模型榜。百万级超长上下文的 KV cache，只有 V3.2 的 10%。亚马逊工程师直言，这直接解决了全球 HBM 短缺的燃眉之急。

更关键的是，DeepSeek 从一开始就走在了自主可控的道路上。它第一时间适配了华为昇腾、寒武纪等国产芯片，彻底摆脱了对英伟达 GPU 的单一依赖。

5 月 8 日，Redis 创始人 Salvatore Sanfilippo 发布了专为 DeepSeek V4 Flash 优化的 Metal 原生推理引擎 ds4.c，在 Mac 上实现了 468 token/s 的惊人预填充速度。根据产品规划，DeepSeek 将在 6 月发布 V4.1 升级版，深度支持 MCP 协议，带来更强的多模态能力。

一个“时代”结束了，另一个“时代”正在开启。

来源：星河商业观察