AI范儿 · 行业观察⏱ 5 分钟
上个周六,DeepSeek 突然宣布 V4 Pro 永久降价 75%,直接把之前限时 2.5 折的促销价变成了永久价格。
这下可把同行给刺激坏了。
仅仅过了两天,小米也官宣 MiMo V2.5 全系永久降价,降价幅度甚至高达 99%。
最终结果就是:MiMo V2.5 Pro 的价格跟 DeepSeek V4 Pro 一模一样。缓存命中 ¥0.025/百万 tokens,未命中输入 ¥3,输出 ¥6。一分钱都不差。
这叫"你敢降我就敢跟"。
01不只是降价
小米这次更狠的不只是降价。
在相同的价格下,Token Plan 的 Credits 额度直接增加了 5 到 8 倍,而且重置了所有在有效期内用户的使用量。
有开发者反馈,自己账户的月度 Token 额度从 7 亿直接飙到了 380 亿,比他过去的总使用量还高 10 倍。另外,MiMo V2.5 TTS 系列继续免费。
也有开发者分析认为,Credits 增加的同时计费倍率也调整了,实际降幅可能没有 99% 那么大。
提示99% 这个数字主要来自缓存命中场景。对于能有效管理 Prompt 缓存的开发者来说,这确实是实打实的降价。但对缓存命中率低的用户,更像是一个"数字游戏"。降价 99% 是真的,但你能不能享受到 99% 的降幅,取决于你写 Prompt 的水平。
这大概是 AI 时代最具黑色幽默的一件事:想省钱?先学会跟 AI 好好说话。
02小米为什么这么急
小米的压力,从 OpenRouter 的排行榜上就能看出来。
在调用量前 10 的模型里面,中国模型一共只有 4 个,而这 4 个里面有 3 个是 DeepSeek。
看不到小米 MiMo 的身影。
在竞争最激烈的编程领域,DeepSeek V4 Flash 和 V4 Pro 的调用量遥遥领先。小米的 MiMo?调用量甚至不如混元和 Kimi。
在另外一个大家很关心的智能体调用领域,比如 OpenClaw(就是大家说的"小龙虾"),情况也差不多。
排名前十里有 4 个是中国模型,主要是 MiniMax、DeepSeek 和 GLM。同样的,这里面也没有 MiMo 的身影。
问题是,从能力上看,MiMo 其实一点都不弱。
维度 MiMo V2.5 Pro DeepSeek V4 Pro 综合智能指数 54 · 开源并列第一 52 · 开源第三 Coding ⚠ 略低于 DS ✓ 更强 Agent 能力 ✓ 略为领先 ⚠ 略低 多模态 ✓ 文/图/音/视频 ✗ 纯文本 API 单价(降价后) ¥3 / ¥6 ¥3 / ¥6
▲ 图:MiMo V2.5 Pro vs DeepSeek V4 Pro 核心维度对比(数据来源:Artificial Analysis)
Artificial Analysis 的综合智能指数显示,MiMo V2.5 Pro 跟 Kimi K2.6 并列开源模型第一,比 DeepSeek V4 Pro 还高。在 Agent 能力上,MiMo 也略为领先。
在吃 Token 最多的 coding 领域,DeepSeek V4 Pro 确实更强一些。
而且小米还有一个 DeepSeek 没有的优势:多模态。MiMo V2.5 支持文本、图像、音频、视频的全模态理解,DeepSeek V4 Pro 目前还是纯文本。
理论上,这样的性能差异不应该导致调用量差出这么多。
但知名度这个东西,有时候就是比模型参数更有杀伤力。好比考试第二名和第一名可能只差一分,但所有人只记得第一名的名字。
03财报的另一面
这两天网络上关于小米的讨论特别多:一个是关于模型降价,另外一个就是昨天的 Q1 财报。
数字不太好看:营收 991 亿元,同比下降 10.9%。经调整净利润 61 亿元,同比下降 43.1%。期间利润更惨,47 亿元,同比下降 56.5%。
主要原因是传统业务板块承压。手机业务受零部件涨价影响,毛利率持续走低。汽车业务又正好赶上 SU7 换代的产品切换期,交付量环比回落。
再看另一组数字:单季研发投入 90 亿元,同比增长 33.4%,研发人员超过 26000 人。传统业务赚的钱变少了,研发投入反而在猛增。
这里面有多大一部分砸进了 AI,财报没细说,但从 MiMo 模型的迭代速度来看,肯定不少。
所以小米现在的处境很明确:传统业务输血变少了,新业务必须更快跑起来。
MiMo 降价不是因为有底气,是因为没退路。
04怎么选
坦率说,我不是 DeepSeek 和 MiMo 的重度用户,但从社区反馈来看,两家的评价都不错。如果你重度使用国内模型的 API,两家都值得试试。
有一点要提醒的是,不要光看标价,要看你的实际使用场景下的真实成本。
缓存命中率、上下文长度、调用频次,这些因素叠加起来,同样标价的两个模型,最终账单可能差出好几倍。
至于价格战本身,对整个行业的影响是实实在在的。
以前很多开发者对 Token 消耗有焦虑,现在这种焦虑确实会缓解很多。当 API 调用从"精打细算"变成"随便用"的时候,真正有意思的应用才会冒出来。
当然,价格战最终卷的不是模型厂商的钱包,是他们的推理效率。降价只是表面文章,背后是推理架构和工程能力的硬仗。
当 API 价格便宜到几乎不要钱的时候,开发者选模型的标准会从"谁更便宜"变成"谁更好用"。
到那个时候,小米和 DeepSeek 的真正较量才刚刚开始。
你现在主力用的国产模型 API 是哪家?体验怎么样?
觉得有用 → 点个❤️在看转给朋友
热门跟贴