AI世界的王座,又换主人。
5月25日,全球开发者公认最中立的大模型聚合平台 OpenRouter更新了榜单。5月18日至24日,中国 AI 企业 DeepSeek 旗下的 V4-Flash 模型,以 3.43 万亿 Token 的周调用量首次登顶全球第一,环比暴涨 66%。OpenAI、谷歌 Gemini、Anthropic Claude,全部被甩在了身后。这不是主场作战的胜利,OpenRouter 的用户 94% 来自海外,中国用户仅占 6%。
更惊人的是整体格局,上周全球大模型总调用量 28.9 万亿 Token,连续五周上涨。中国大模型周调用量 9.223 万亿 Token,环比增长 19.89%;美国仅为 4.93 万亿 Token,环比增长 16.27%。中国已经连续四周领跑全球,且领先优势还在越拉越大。榜单前三,中国包揽前两名。腾讯 Hy3 preview 以 3.07 万亿 Token 紧随其后,Owl Alpha 跻身前五。
DeepSeek 更是杀疯了,前九名里独占三席,旗下模型总调用量 5.74 万亿 Token,连续两周位居全球厂商第一,全面碾压 OpenAI 全系产品。
当中国大模型开始收割全球开发者,最先坐不住的是硅谷的巨头们。
过去十年,全球 AI 行业被一条铁律牢牢绑架 —— 缩放定律。所有人都相信,性能提升只能靠堆参数量、堆算力。这直接催生了一场烧钱军备竞赛,谁能拿到更多英伟达 GPU,谁就能站在行业顶端。但 DeepSeek 用最直接的方式,撕碎了这条铁律。它证明了,性能提升≠单纯堆算力。极致的工程优化,能把同样的算力,发挥出十倍甚至百倍的价值。
最致命的是价格。DeepSeek-V4-Flash 每百万 Token 输入(缓存命中)仅 0.02 元人民币,是 Kimi K2.6 的 1/55、 GPT-5.5 的 1/180;DeepSeek-V4-Flash 每百万 Token 输出价格是 Kimi K2.6 的 1/14、 GPT-5.5 的 1/108。同样的预算,用 DeepSeek 跑一天,用 GPT-5.5 可能只跑 19 分钟。这不是差距,是降维打击。
DeepSeek的登顶,是过去一个月一系列雷霆动作的集中爆发。
一个月两次降价。4月26日,DeepSeek 突然将全系 API 缓存命中价格砍到首发价的十分之一。5月22日,它又扔出一颗重磅炸弹:V4-Pro 模型在 5 月 31 日限时 2.5 折优惠结束后,定价直接锁定为原价的 1/4,永不恢复。
更狠的是,DeepSeek 根本没打算给对手留喘息的机会。
就在降价消息刷屏的同时,媒体曝出了 DeepSeek 的融资计划,700 亿元人民币首轮融资,投前估值可能高达 450 亿美元。这将刷新中国科技初创公司首轮融资的历史纪录。国家人工智能产业投资基金拟领投 100 亿元,腾讯、IDG 资本等确认参投;更有市场消息称,宁德时代已决定参与DeepSeek首轮融资。
最让人敬佩的是,创始人梁文锋个人出资约 200 亿元,牢牢掌握公司控股权。DeepSeek 明确表态,融资所得 70% 全部投入研发,坚持开源路线,短期不追求商业化变现。唯一的目标,就是突破技术边界,实现通用人工智能。
技术上的硬实力,才是 DeepSeek 最硬的底气。V4-Pro 发布直接登顶 Hugging Face 开源模型榜。百万级超长上下文的 KV cache,只有 V3.2 的 10%。亚马逊工程师直言,这直接解决了全球 HBM 短缺的燃眉之急。
更关键的是,DeepSeek 从一开始就走在了自主可控的道路上。它第一时间适配了华为昇腾、寒武纪等国产芯片,彻底摆脱了对英伟达 GPU 的单一依赖。
5 月 8 日,Redis 创始人 Salvatore Sanfilippo 发布了专为 DeepSeek V4 Flash 优化的 Metal 原生推理引擎 ds4.c,在 Mac 上实现了 468 token/s 的惊人预填充速度。根据产品规划,DeepSeek 将在 6 月发布 V4.1 升级版,深度支持 MCP 协议,带来更强的多模态能力。
一个“时代”结束了,另一个“时代”正在开启。
来源:星河商业观察