2025年11月,95后AI研究员罗福莉离开DeepSeek,加入小米担任MiMo大模型负责人。雷军被传以千万年薪将其招入麾下。四个月后,她主导的MiMo-V2.5系列发布。又过了一个月,小米宣布该系列API永久降价,最高降幅99%,价格直接对标她此前任职的DeepSeek。
这不是一个简单的价格战故事。同样一份降价声明,从左边看是技术红利的释放,从右边看是生态版图的卡位。两家公司把同一张牌打出了完全不同的牌型。
DeepSeek的降价逻辑是技术溢出。其V3模型以约600万美元的训练成本实现了对标GPT-4级别的性能,仅为同类模型的数十分之一。V4系列搭载自研稀疏注意力机制,处理百万级Token长上下文时,算力消耗降至上代产品的27%,KV缓存占用缩至10%。架构层面的工程优化把单位推理成本压到了行业地板以下,降价只是把省下来的成本让渡给市场。V4-Pro的缓存命中输入降至每百万Tokens 0.025元,这不是补贴出来的价格,是算出来的价格。
小米的降价逻辑是生态卡位。5月26日,雷军宣布未来三年在AI领域投入600亿元。一季度研发投入90亿元,同比增长33.4%,全年研发预计超400亿元。这些钱一部分用于追赶技术差距,一部分用于摊薄推理成本。当你的手机、汽车、空调、音箱都在跑同一个模型时,规模效应自然会把单位成本打下来。API降价不是为了卖Token赚钱,而是让开发者先上车。
一条时间线把两家的动作串了起来。5月22日,DeepSeek宣布V4-Pro模型API价格永久降价75%,缓存命中输入低至每百万Tokens 0.025元。5月27日,小米MiMo-V2.5系列跟进:Pro版缓存命中输入同样降至0.025元,标准版更低,0.02元。输出端,Pro版从42元降至6元,降幅86%;标准版从28元降至2元,降幅93%。同时取消上下文窗口长度的区分定价,优化Token Plan计费,同等价格下Token用量提升5到8倍。两家在同一条起跑线上开火。
正方观点很明确:这是AI普惠的加速器。技术红利不该锁在实验室里,降价让更多开发者用得起、用得久、用得深。大模型API正在从奢侈品变成日用品,价格门槛的拆除本身就是技术进步的外显。DeepSeek证明了架构创新可以同时提升性能和降低成本,小米证明了硬件生态可以反向哺育AI基础设施。
反方观点也不含糊:这种降幅不可持续。在推理端调用量激增、算力和存储成本持续高企的背景下,多数大模型公司选择涨价,部分涨幅高达463%。DeepSeek和小米的逆市降价,究竟是真实的成本优势,还是用其他业务利润在补贴AI战场?如果是后者,当补贴结束,真实成本浮出水面时,开发者的迁移成本谁来承担?
我的判断是:这场降价不是简单的促销行为,而是两种技术路线走到同一节点的必然结果。DeepSeek走的是纯技术路线。V3总参数671B,单Token仅激活约37B,激活占比约5.5%。MLA机制把KV缓存压缩到传统注意力的几分之一。这是从第一性原理出发重构算力消耗。
小米走的是软硬协同路线。MiMo-V2.5-Pro采用MoE架构,总参数1.02T,激活42B,预训练27万亿Token,原生序列32K后扩展至1M。Artificial Analysis综合智能指数和Agent指数上,全球开源模型并列第一。SWE-bench Pro得分57.2%,超过DeepSeek V4 Pro的55.4%和Gemini 3.1 Pro的54.2%。Agent任务ClawEval得分63.8%,全球开源第一。每条任务轨迹仅消耗约7万Token,与同等能力模型相比减少40%到60%。这些数据说明:小米的降价不是跟风,是能力到了。
更关键的分野在人车家全生态。小米一季度研发投入90亿元,AI正在渗透手机、汽车、智能家居全产品线。从DeepSeek到小米,罗福莉带来了一种工程师驱动的技术文化,强调效率、追求低成本高回报。几个月内,团队从MiMo-V2-Pro迭代到V2.5系列,完成从语言到多模态到语音的全矩阵布局。2026年以来,小米密集发布VLA大模型、移动端Agent产品Xiaomi miclaw、语音合成与识别模型、自动驾驶模型,覆盖面和迭代速度在业界罕见。
这场对决走到今天,价格只是水面上的显影。水面下,DeepSeek在验证一条纯技术路线的商业可行性:如果架构创新的红利足够大,它可以不依赖任何硬件生态,独立存活。小米在验证另一条路:当大模型不再是一个独立产品,而是手机、汽车、家居的底层驱动力时,API价格可以趋近于零,因为价值已经在终端产品里兑现了。
两种降价逻辑,两种对AI未来的理解,正在同一张价目表上博弈。开发者今天的选择也许不是因为哪家更便宜,而是你更相信哪一种路线会最终胜出。
热门跟贴