小米大模型降价99%：一场关于AI路线的双雄博弈|mimo|大模型|小米集团|物理世界|知名企业

2025年11月，95后AI研究员罗福莉离开DeepSeek，加入小米担任MiMo大模型负责人。雷军被传以千万年薪将其招入麾下。四个月后，她主导的MiMo-V2.5系列发布。又过了一个月，小米宣布该系列API永久降价，最高降幅99%，价格直接对标她此前任职的DeepSeek。

这不是一个简单的价格战故事。同样一份降价声明，从左边看是技术红利的释放，从右边看是生态版图的卡位。两家公司把同一张牌打出了完全不同的牌型。

DeepSeek的降价逻辑是技术溢出。其V3模型以约600万美元的训练成本实现了对标GPT-4级别的性能，仅为同类模型的数十分之一。V4系列搭载自研稀疏注意力机制，处理百万级Token长上下文时，算力消耗降至上代产品的27%，KV缓存占用缩至10%。架构层面的工程优化把单位推理成本压到了行业地板以下，降价只是把省下来的成本让渡给市场。V4-Pro的缓存命中输入降至每百万Tokens 0.025元，这不是补贴出来的价格，是算出来的价格。

小米的降价逻辑是生态卡位。5月26日，雷军宣布未来三年在AI领域投入600亿元。一季度研发投入90亿元，同比增长33.4%，全年研发预计超400亿元。这些钱一部分用于追赶技术差距，一部分用于摊薄推理成本。当你的手机、汽车、空调、音箱都在跑同一个模型时，规模效应自然会把单位成本打下来。API降价不是为了卖Token赚钱，而是让开发者先上车。

一条时间线把两家的动作串了起来。5月22日，DeepSeek宣布V4-Pro模型API价格永久降价75%，缓存命中输入低至每百万Tokens 0.025元。5月27日，小米MiMo-V2.5系列跟进：Pro版缓存命中输入同样降至0.025元，标准版更低，0.02元。输出端，Pro版从42元降至6元，降幅86%；标准版从28元降至2元，降幅93%。同时取消上下文窗口长度的区分定价，优化Token Plan计费，同等价格下Token用量提升5到8倍。两家在同一条起跑线上开火。

正方观点很明确：这是AI普惠的加速器。技术红利不该锁在实验室里，降价让更多开发者用得起、用得久、用得深。大模型API正在从奢侈品变成日用品，价格门槛的拆除本身就是技术进步的外显。DeepSeek证明了架构创新可以同时提升性能和降低成本，小米证明了硬件生态可以反向哺育AI基础设施。

反方观点也不含糊：这种降幅不可持续。在推理端调用量激增、算力和存储成本持续高企的背景下，多数大模型公司选择涨价，部分涨幅高达463%。DeepSeek和小米的逆市降价，究竟是真实的成本优势，还是用其他业务利润在补贴AI战场？如果是后者，当补贴结束，真实成本浮出水面时，开发者的迁移成本谁来承担？

我的判断是：这场降价不是简单的促销行为，而是两种技术路线走到同一节点的必然结果。DeepSeek走的是纯技术路线。V3总参数671B，单Token仅激活约37B，激活占比约5.5%。MLA机制把KV缓存压缩到传统注意力的几分之一。这是从第一性原理出发重构算力消耗。

小米走的是软硬协同路线。MiMo-V2.5-Pro采用MoE架构，总参数1.02T，激活42B，预训练27万亿Token，原生序列32K后扩展至1M。Artificial Analysis综合智能指数和Agent指数上，全球开源模型并列第一。SWE-bench Pro得分57.2%，超过DeepSeek V4 Pro的55.4%和Gemini 3.1 Pro的54.2%。Agent任务ClawEval得分63.8%，全球开源第一。每条任务轨迹仅消耗约7万Token，与同等能力模型相比减少40%到60%。这些数据说明：小米的降价不是跟风，是能力到了。

更关键的分野在人车家全生态。小米一季度研发投入90亿元，AI正在渗透手机、汽车、智能家居全产品线。从DeepSeek到小米，罗福莉带来了一种工程师驱动的技术文化，强调效率、追求低成本高回报。几个月内，团队从MiMo-V2-Pro迭代到V2.5系列，完成从语言到多模态到语音的全矩阵布局。2026年以来，小米密集发布VLA大模型、移动端Agent产品Xiaomi miclaw、语音合成与识别模型、自动驾驶模型，覆盖面和迭代速度在业界罕见。

这场对决走到今天，价格只是水面上的显影。水面下，DeepSeek在验证一条纯技术路线的商业可行性：如果架构创新的红利足够大，它可以不依赖任何硬件生态，独立存活。小米在验证另一条路：当大模型不再是一个独立产品，而是手机、汽车、家居的底层驱动力时，API价格可以趋近于零，因为价值已经在终端产品里兑现了。

两种降价逻辑，两种对AI未来的理解，正在同一张价目表上博弈。开发者今天的选择也许不是因为哪家更便宜，而是你更相信哪一种路线会最终胜出。