打开网易新闻 查看精彩图片

2025年小米人车家全生态合作伙伴大会上,一个名字和一款模型同时引爆AI圈。被传“雷军花千万年薪挖来”的AI大牛罗福莉,首次以小米MiMo大模型负责人的身份公开亮相,带来了小米新一代自研大语言模型MiMo-V2-Flash——不仅性能对标顶尖开源模型,还以“3090亿总参数+150亿活跃参数”的MoE架构实现极致效率,更关键的是,它刚发布就全线开源。

打开网易新闻 查看精彩图片

大模型赛道还在比拼“参数越大越厉害”的当下,小米反其道而行之,用“跑得快、跑得久、被高频调用也跑得起”的设计理念,给行业浇了一盆清醒剂。这款模型背后,既有罗福莉团队的技术取舍,更藏着小米对AGI(通用人工智能)的独特思考:智能不是“读”出来的,而是“活”出来的。

一、幕后推手:从顶会学霸到小米AI掌舵人

要理解MiMo-V2-Flash的创新逻辑,先得认识它的“操盘手”罗福莉。这位北大计算机硕士出身的技术大牛,学生时代就创下“一次性在国际顶会ACL中标8篇论文”的纪录,其中2篇以第一作者身份发表,一度冲上知乎热搜,成为AI圈公认的“潜力股”。

打开网易新闻 查看精彩图片

毕业后,罗福莉先后加盟阿里巴巴达摩院、DeepSeek母公司幻方量化,在幻方期间深度参与了DeepSeek-V2等爆款模型的研发,积累了从基础研究到工程落地的全链条经验。2025年11月,她正式官宣加入小米,这次大会是她入职后的首次公开演讲。

打开网易新闻 查看精彩图片

尽管略显紧张,但罗福莉条理清晰地传递了核心观点:“大模型解码了人类思维的文本投影,却没真正理解物理世界”。正是这种清醒的认知,让MiMo-V2-Flash跳出了“参数竞赛”的怪圈,走上了“实用主义”的道路。

二、技术拆解:为什么它能“又快又便宜”?

普通人可能看不懂“3090亿总参数”“150亿活跃参数”的差距,但只要记住一个核心:MiMo-V2-Flash用更小的“运行成本”,实现了和顶尖模型相当的性能。这背后是两大关键技术的支撑:

1.MoE架构:只“点亮”需要的部分

MiMo-V2-Flash采用了当下最先进但工程难度极高的MoE(混合专家)架构。简单说,这个模型就像一个“专家团队”,总共有3090亿个“专家”(参数),但处理任务时,只需要150亿个“相关专家”上阵,其他专家可以“休息”。

这种设计的好处显而易见:既保留了大模型的综合能力,又大大降低了推理时的算力消耗。打个比方,这就像请了一支全能乐队,但演出时只需要根据歌曲风格,安排对应的乐手上场,既保证了演出质量,又节省了场地和设备成本。

2.MTP技术:让输出速度“翻倍”

如果说MoE架构解决了“轻量化”问题,那么MTP(多词元预测)技术就解决了“速度”问题。罗福莉团队在预训练和微调阶段都加入了MTP层,推理时更是采用三层MTP并行推理,让模型输出速度直接提升2-2.6倍。

打开网易新闻 查看精彩图片

根据社区测试数据,MiMo-V2-Flash在单机环境下,每秒能处理5000-15000个token(相当于2-7.5万字),单请求输出速度也能达到150token/s(约75字/秒)。对比来看,它的推理速度是DeepSeek-V3.2的3倍左右,而成本却更低;和综合能力相近的Gemini2.5Pro相比,成本直接低了20倍。

除此之外,小米还创新了HybridAttention(混合注意力)结构和MOPD(多教师在线蒸馏)范式,前者兼顾了长短文本处理能力和推理效率,后者则让模型在强化学习阶段快速吸收多个“专家模型”的优点,用更少的算力实现能力升级。

三、实测实力:在核心赛道冲进“第一梯队”

光有技术创新还不够,模型好不好用,得用数据说话。小米官方公布了MiMo-V2-Flash在7项主流评测中的成绩,对手包括开源的DeepSeek-V3.2、K2-Thinking,以及闭源的ClaudeSonnet4.5、GPT-5(High)等顶尖模型。

结果显示,MiMo-V2-Flash在Agent(智能体)、代码、工具调用、复杂任务执行这四大核心场景中,已经跻身全球第一梯队。尤其在权威的SWE-Bench软件工程测试中,它以71.7%的准确率拿下多语言模式第一,证明了其在实际工业场景中的实用价值。

打开网易新闻 查看精彩图片

对于开发者和企业来说,这意味着什么?以前需要高昂成本才能接入的顶尖模型能力,现在通过开源的MiMo-V2-Flash就能免费获得。无论是WebCoding、IDE工具集成,还是智能终端的Agent交互,都能以极低的成本实现高效部署。

打开网易新闻 查看精彩图片

四、行业启示:开源+实用,小米的AGI路线图

罗福莉在演讲中反复强调:“这只是我们在AGI路线图上的第二步”。这句话的背后,是小米对AI未来的清晰判断:

首先,大模型的竞争已经从“预训练规模”转向“后训练效率”。随着Agent场景的普及,模型需要持续通过强化学习迭代升级,稳定、可扩展的训练体系比单纯的参数规模更重要。

其次,开源是缩短技术差距的关键。在罗福莉看来,开源不只是共享代码和权重,更是一种“分布式技术加速机制”。通过开源,小米能汇聚全球开发者的力量,共同优化模型,让AGI更快走向普惠。

最后,下一代智能体必须“落地现实”。当前大模型之所以会出现“具身幻觉”,比如不懂重力、不理解时空关系,核心是因为它们只从文本中学习,没有真正和物理世界交互。罗福莉认为,未来的智能体需要构建“统一的世界模型”,从“回答问题”转向“完成任务”,从“文本模拟”走向“实体交互”。

结语:效率革命背后的AI新方向

MiMo-V2-Flash的发布,不仅是小米在AI赛道的一次重要突破,更给整个行业带来了新的思考:大模型的终极目标不是“更聪明”,而是“更好用”。当其他厂商还在比拼参数规模时,小米已经用工程优化实现了“性价比拉满”的效果,这或许就是未来大模型的核心竞争力。

随着开源生态的完善和Agent场景的普及,MiMo-V2-Flash可能会成为更多开发者和企业的首选基座模型。而罗福莉提出的“智能要在交互中活出来”的理念,也预示着AI行业将从“文本大模型”时代,逐步迈向“具身智能”时代。

对于普通人来说,这意味着未来的智能设备会更懂需求、响应更快、使用成本更低——或许不久后,我们在小米手机、智能眼镜、汽车里感受到的AI交互,都将源自这个“跑得快、用得起”的大模型。而这,只是小米AGI路线图的第二步,更精彩的还在后面。