硬刚DeepSeek-V4！小米最强开源模型来了，国产芯片全适配|deepseek|mimo|小米集团|开源模型|知名企业

4月28日凌晨，小米AI团队正式开源由罗福莉带队研发的MiMo-V2.5系列大模型，瞬间引爆国内AI圈。这款模型不仅在多项权威测评中超越近期大热的DeepSeek-V4-Pro，还采用宽松的MIT协议，支持商用部署与二次训练，无需额外授权。更重磅的是，小米同步推出百万亿Token免费激励计划，联手多家芯片与Agent厂商共建生态。从技术硬实力到生态布局，MiMo-V2.5的登场，堪称国产开源大模型赛道的一次“亮剑”交锋。

一、两款核心模型亮相：百万上下文+超强Agent能力

此次开源的MiMo-V2.5系列包含两款核心模型，均在4月23日开启公测，经过5天打磨后正式开放权重，主打“强推理、长上下文、高适配性”三大亮点。

MiMo-V2.5-Pro：旗舰级智能体模型

作为小米迄今最强的语言模型，MiMo-V2.5-Pro是1.02万亿参数的混合专家（MoE）模型，其中420亿参数处于激活状态，专为复杂Agent任务、软件工程和长时域场景打造。它支持100万Token上下文，相当于一次性处理整本《三体》三部曲的文本量，能稳定完成单次近千轮工具调用的长任务，全程逻辑不脱节。

技术上，它继承混合注意力架构，局部滑动窗口与全局注意力以6:1比例搭配，让长文本处理时的显存占用减少近7倍；搭配轻量级多标记预测（MTP）模块，推理吞吐量直接提升3倍。预训练阶段使用27万亿Token，后训练分监督微调、领域专精、多教师蒸馏三阶段，把数学、安全、工具使用等能力拉满。

MiMo-V2.5：全模态全能模型

另一款MiMo-V2.5是3100亿参数的稀疏MoE模型，150亿激活参数，主打原生全模态能力，能同时理解文本、图像、视频和音频。训练数据达48万亿Token，分五阶段完成：先练文本主干，再对齐音视频投影器，接着做多模态预训练，随后扩容上下文至100万Token，最后用强化学习优化推理与执行能力。

在Claw-EvalText、Terminal-Bench2.0等测评中，MiMo-V2.5大幅超越DeepSeek-V4-Flash，成为开源模型中的第一梯队选手。

二、硬实力碾压：多项测评超越DeepSeek与闭源模型

开源当日，小米公布MiMo-V2.5-Pro的完整基准测试结果，成绩堪称“炸裂”。在GDPVal-AA（Elo）、Claw-Eval（pass^3）等权威测评中，它不仅超过最新开源的DeepSeek-V4-Pro，还力压发布不久的KimiK2.6等主流闭源模型，拿下全球开源模型第一的位置。

简单说，它的优势体现在三点：

Agent能力拉满：能独立拆解复杂任务，自动调用工具完成操作，在代码生成、文档分析、多轮对话中表现稳定；

Token效率极高：完成同等任务，比ClaudeOpus4.6等模型少用40%-60%的Token，推理成本直接减半；

长文本无压力：100万上下文窗口，彻底解决传统模型“长对话失忆、长任务断档”的痛点。

小米官方强调，模型的价值不止于榜单排名，更在于能帮开发者高效解决实际问题——从写代码、做数据分析，到生成视频脚本、处理音频内容，MiMo-V2.5系列都能胜任。

三、开源即适配：7大芯片厂商+2大推理框架无缝对接

大模型光有性能不够，落地适配才是关键。MiMo-V2.5-Pro开源首日，就完成7家主流芯片厂商的接入适配，实现“发布即用”。

具体适配名单包括：阿里平头哥（真武810E芯片）、亚马逊云科技（Trainium2芯片）、AMD（ROCm软件栈）、百度昆仑芯、燧原科技（L600芯片）、沐曦（曦云C系列）、天数智芯。同时，模型同步完成SGLang和vLLM两大主流推理框架的Day0适配，开发者可直接用主流工具部署，无需额外修改代码。

这种“开源即全适配”的节奏，在行业内实属罕见。此前，不少模型开源后，还需数周甚至数月才能完成多芯片适配，而小米直接把适配周期压缩到“0天”，大幅降低企业与开发者的部署门槛。

四、生态大动作：百万亿Token免费送，联手Agent框架共建

除了开源模型，小米同步启动MiMoOrbit计划，包含两大重磅举措，直接降低AI创业与开发成本。

百万亿Token免费激励：30天发完，最高领16亿Credits

面向全球AI用户，小米推出“百万亿Token创造者激励计划”，30天内免费发放100万亿Token权益，活动时间为4月28日至5月28日。活动采取申请制，通过者最高可获得Max档位，包含16亿Credits，价值659元，相当于免费使用顶级大模型一整年。

Agent生态共建：联手头部框架，助力应用落地

针对Agent赛道，小米推出“Agent生态共建计划”，已与OpenCode、HermesAgent、KiloCode等头部Agent框架厂商深度合作。小米为这些框架提供MiMoToken限免支持，还参与赞助AIHackathon等共创活动，助力开发者基于MiMo快速搭建智能体应用。

从免费Token到生态共建，小米的思路很明确：不只是做模型技术，更要搭平台、建生态，让更多人能用得起、用得好顶级AI模型。

五、国产开源大模型“亮剑”：从拼参数到拼应用

近期，国产开源大模型赛道热闹非凡，DeepSeek、腾讯、月之暗面等厂商密集发布新一代模型，竞争焦点已从“比参数大小”转向“拼推理效率、拼落地成本、拼生态完善度”。

小米MiMo-V2.5的开源，更是直接与DeepSeek-V4在开源赛道正面交锋。此前，DeepSeek-V4凭借万亿参数与强性能，被视为国产开源模型的标杆；如今，MiMo-V2.5-Pro在多项测评中实现反超，打破了DeepSeek的“一家独大”格局。

更重要的是，MiMo-V2.5采用MIT协议，完全开放商用权限，叠加百万亿Token免费计划，大幅降低中小企业与个人开发者的AI使用门槛。这种“技术开放+成本下放”的模式，正是国产大模型突围全球竞争的关键——用更低的成本、更完善的生态，倒逼行业加速从“技术军备竞赛”转向“应用价值落地”。