打开网易新闻 查看精彩图片

4月28日凌晨,小米AI团队正式开源由罗福莉带队研发的MiMo-V2.5系列大模型,瞬间引爆国内AI圈。这款模型不仅在多项权威测评中超越近期大热的DeepSeek-V4-Pro,还采用宽松的MIT协议,支持商用部署与二次训练,无需额外授权。更重磅的是,小米同步推出百万亿Token免费激励计划,联手多家芯片与Agent厂商共建生态。从技术硬实力到生态布局,MiMo-V2.5的登场,堪称国产开源大模型赛道的一次“亮剑”交锋。

打开网易新闻 查看精彩图片

一、两款核心模型亮相:百万上下文+超强Agent能力

此次开源的MiMo-V2.5系列包含两款核心模型,均在4月23日开启公测,经过5天打磨后正式开放权重,主打“强推理、长上下文、高适配性”三大亮点。

MiMo-V2.5-Pro:旗舰级智能体模型

作为小米迄今最强的语言模型,MiMo-V2.5-Pro是1.02万亿参数的混合专家(MoE)模型,其中420亿参数处于激活状态,专为复杂Agent任务、软件工程和长时域场景打造。它支持100万Token上下文,相当于一次性处理整本《三体》三部曲的文本量,能稳定完成单次近千轮工具调用的长任务,全程逻辑不脱节。

技术上,它继承混合注意力架构,局部滑动窗口与全局注意力以6:1比例搭配,让长文本处理时的显存占用减少近7倍;搭配轻量级多标记预测(MTP)模块,推理吞吐量直接提升3倍。预训练阶段使用27万亿Token,后训练分监督微调、领域专精、多教师蒸馏三阶段,把数学、安全、工具使用等能力拉满。

MiMo-V2.5:全模态全能模型

另一款MiMo-V2.5是3100亿参数的稀疏MoE模型,150亿激活参数,主打原生全模态能力,能同时理解文本、图像、视频和音频。训练数据达48万亿Token,分五阶段完成:先练文本主干,再对齐音视频投影器,接着做多模态预训练,随后扩容上下文至100万Token,最后用强化学习优化推理与执行能力。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

在Claw-EvalText、Terminal-Bench2.0等测评中,MiMo-V2.5大幅超越DeepSeek-V4-Flash,成为开源模型中的第一梯队选手。

二、硬实力碾压:多项测评超越DeepSeek与闭源模型

开源当日,小米公布MiMo-V2.5-Pro的完整基准测试结果,成绩堪称“炸裂”。在GDPVal-AA(Elo)、Claw-Eval(pass^3)等权威测评中,它不仅超过最新开源的DeepSeek-V4-Pro,还力压发布不久的KimiK2.6等主流闭源模型,拿下全球开源模型第一的位置。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

简单说,它的优势体现在三点:

Agent能力拉满:能独立拆解复杂任务,自动调用工具完成操作,在代码生成、文档分析、多轮对话中表现稳定;

Token效率极高:完成同等任务,比ClaudeOpus4.6等模型少用40%-60%的Token,推理成本直接减半;

长文本无压力:100万上下文窗口,彻底解决传统模型“长对话失忆、长任务断档”的痛点。

小米官方强调,模型的价值不止于榜单排名,更在于能帮开发者高效解决实际问题——从写代码、做数据分析,到生成视频脚本、处理音频内容,MiMo-V2.5系列都能胜任。

三、开源即适配:7大芯片厂商+2大推理框架无缝对接

大模型光有性能不够,落地适配才是关键。MiMo-V2.5-Pro开源首日,就完成7家主流芯片厂商的接入适配,实现“发布即用”。

具体适配名单包括:阿里平头哥(真武810E芯片)、亚马逊云科技(Trainium2芯片)、AMD(ROCm软件栈)、百度昆仑芯、燧原科技(L600芯片)、沐曦(曦云C系列)、天数智芯。同时,模型同步完成SGLang和vLLM两大主流推理框架的Day0适配,开发者可直接用主流工具部署,无需额外修改代码。

这种“开源即全适配”的节奏,在行业内实属罕见。此前,不少模型开源后,还需数周甚至数月才能完成多芯片适配,而小米直接把适配周期压缩到“0天”,大幅降低企业与开发者的部署门槛。

四、生态大动作:百万亿Token免费送,联手Agent框架共建

除了开源模型,小米同步启动MiMoOrbit计划,包含两大重磅举措,直接降低AI创业与开发成本。

百万亿Token免费激励:30天发完,最高领16亿Credits

面向全球AI用户,小米推出“百万亿Token创造者激励计划”,30天内免费发放100万亿Token权益,活动时间为4月28日至5月28日。活动采取申请制,通过者最高可获得Max档位,包含16亿Credits,价值659元,相当于免费使用顶级大模型一整年。

Agent生态共建:联手头部框架,助力应用落地

针对Agent赛道,小米推出“Agent生态共建计划”,已与OpenCode、HermesAgent、KiloCode等头部Agent框架厂商深度合作。小米为这些框架提供MiMoToken限免支持,还参与赞助AIHackathon等共创活动,助力开发者基于MiMo快速搭建智能体应用。

从免费Token到生态共建,小米的思路很明确:不只是做模型技术,更要搭平台、建生态,让更多人能用得起、用得好顶级AI模型。

五、国产开源大模型“亮剑”:从拼参数到拼应用

近期,国产开源大模型赛道热闹非凡,DeepSeek、腾讯、月之暗面等厂商密集发布新一代模型,竞争焦点已从“比参数大小”转向“拼推理效率、拼落地成本、拼生态完善度”。

小米MiMo-V2.5的开源,更是直接与DeepSeek-V4在开源赛道正面交锋。此前,DeepSeek-V4凭借万亿参数与强性能,被视为国产开源模型的标杆;如今,MiMo-V2.5-Pro在多项测评中实现反超,打破了DeepSeek的“一家独大”格局。

更重要的是,MiMo-V2.5采用MIT协议,完全开放商用权限,叠加百万亿Token免费计划,大幅降低中小企业与个人开发者的AI使用门槛。这种“技术开放+成本下放”的模式,正是国产大模型突围全球竞争的关键——用更低的成本、更完善的生态,倒逼行业加速从“技术军备竞赛”转向“应用价值落地”。

从技术性能超越头部竞品,到开源即全芯片适配,再到百亿级Token免费发放与生态共建,小米MiMo-V2.5系列的开源,不仅是自身技术实力的一次集中展示,更是国产开源大模型走向成熟的重要标志。

未来,随着MiMo、DeepSeek、腾讯等国产模型持续发力,开源赛道的竞争会更激烈,但对开发者和企业而言,这意味着更多选择、更低成本、更完善的生态。属于国产AI的“黄金时代”,才刚刚开始。