【太平洋科技快讯】3月19日消息,小米今日正式发布三款面向Agent时代的大模型,分别是旗舰基座模型MiMo-V2-Pro、全模态基座模型MiMo-V2-Omni,以及语音合成大模型MiMo-V2-TTS,全面升级其AI能力矩阵。

MiMo-V2-Pro作为旗舰基座,拥有超过1T总参数量(42B激活)和1M超长上下文,专为高强度Agent任务打造。其在全球权威榜单Artificial Analysis上位列第八、国内第二,整体使用体感超越Claude Sonnet 4.6,逼近Opus 4.6,但API定价仅为后者的1/5。该模型已深度集成至WPS、小米浏览器及手机智能体“miclaw”中,并联合多家开发框架提供限时免费体验。

模态模型MiMo-V2-Omni则统一了文本、视觉与语音的感知与行动能力,能执行跨模态理解、浏览器操控等复杂任务。其匿名测试版本「Healer Alpha」曾在OpenRouter平台调用量攀升平台前列,并在OpenClaw测评榜单上获得均分第一,多模态感知能力对标国际顶尖水平。

同期发布的MiMo-V2-TTS语音合成模型基于自研Audio Tokenizer和多码本语音-文本联合建模架构,经过上亿小时语音数据训练与多维度强化学习,支持从整体风格到局部情绪的精细控制,并能实现方言、角色扮演及歌声合成。该模型旨在为智能体赋予富有情感和表现力的“声音”,让AI交互更具温度。

目前,三款模型均已开放API服务,并已在小米及金山办公旗下多款产品中落地应用。

打开APP,阅读体验更佳