小米发布MiMo-V2-Pro旗舰基座/Omni全模态/TTS语音大模型，进击Agent时代

2026-03-19 12:06 ·广东 ·优质数码领域创作者

【太平洋科技快讯】3月19日消息，小米今日正式发布三款面向Agent时代的大模型，分别是旗舰基座模型MiMo-V2-Pro、全模态基座模型MiMo-V2-Omni，以及语音合成大模型MiMo-V2-TTS，全面升级其AI能力矩阵。

MiMo-V2-Pro作为旗舰基座，拥有超过1T总参数量(42B激活)和1M超长上下文，专为高强度Agent任务打造。其在全球权威榜单Artificial Analysis上位列第八、国内第二，整体使用体感超越Claude Sonnet 4.6，逼近Opus 4.6，但API定价仅为后者的1/5。该模型已深度集成至WPS、小米浏览器及手机智能体“miclaw”中，并联合多家开发框架提供限时免费体验。

全模态模型MiMo-V2-Omni则统一了文本、视觉与语音的感知与行动能力，能执行跨模态理解、浏览器操控等复杂任务。其匿名测试版本「Healer Alpha」曾在OpenRouter平台调用量攀升平台前列，并在OpenClaw测评榜单上获得均分第一，多模态感知能力对标国际顶尖水平。

同期发布的MiMo-V2-TTS语音合成模型基于自研Audio Tokenizer和多码本语音-文本联合建模架构，经过上亿小时语音数据训练与多维度强化学习，支持从整体风格到局部情绪的精细控制，并能实现方言、角色扮演及歌声合成。该模型旨在为智能体赋予富有情感和表现力的“声音”，让AI交互更具温度。

目前，三款模型均已开放API服务，并已在小米及金山办公旗下多款产品中落地应用。

打开APP，阅读体验更佳

打开网易新闻体验更佳