克雷西 发自 凹非寺
量子位 | 公众号 QbitAI
占领OpenRouter调用量榜单第一的神秘模型Hunter Alpha,终于揭开神秘面纱——
既不是GPT,也不是DeepSeek,而是来自小米的万亿旗舰模型MiMo-V2-Pro。
就在今天凌晨,小米团队官宣了MiMo-V2家族三款新模型,分别是Pro、Omni和TTS。
其中对于Pro,小米在官方介绍中明确提到,就是此前的Hunter Alpha。
在这之前,网友们对这两款模型的身份可谓是猜什么的都有,有的说是GPT,也有人觉得是DeepSeek。
当知道它的真实身份是小米的时候,很多人都为之惊讶。
MiMo-V2-Pro参数规模万亿,支持百万级长文本,非常擅长应对真实场景中的任务。
它在Artificial Analysis全球智能指数里拿了全球第八和国内第二的好成绩。
无论是调用工具还是规划复杂任务,它的表现也都相当扎实,能直接用Three.js写出一个带有动态背景和升级路线的3D塔防游戏代码。
当然,一同亮相的Omni和语音合成模型TTS,也同样实力强悍。
小米三款模型一同亮相
作为整个家族的旗舰大模型,MiMo-V2-Pro核心设计围绕真实世界的智能体工作流展开。
它的模型总参数量突破了1T大关,激活参数达到42B,上下文窗口1M,整体规模大约是MiMo-V2-Flash的三倍。
在底层架构设计上,它继承了混合注意力机制,并且将混合比例从5:1大幅提升到了7:1,兼顾了超大规模与极高的推理效率。
搭配轻量级的MTP多Token预测层,模型在处理高达1M Token超长上下文时依然能够保持极快的生成速度。
为了支撑如此庞大的模型训练与运行,小米AI团队与北京大学联合研发了统一资源管理系统ARL-Tangram。
这套系统采用了统一的动作级公式和弹性调度算法,完美解决了异构资源约束的难题,将平均动作完成时间提升了高达4.3分。
在真实世界的智能体强化学习任务中,该系统让训练步骤的持续时间至多缩短了1.5倍,直接将算力成本与外部资源消耗大幅降低了71.2%。
在具体的性能表现上,MiMo-V2-Pro交出了一份相当亮眼的成绩单。
根据Artificial Analysis的最新评测,它成功拿下了国产第二、全球第八和的优异排名。
在评估通用智能体能力的权威基准中,它在PinchBench上获得了84.0的高分,在ClawEval中也拿到了61.5分,整体表现全面超越了Gemini 3 Pro,并逼近Claude Opus 4.6。
而在代码能力方面,它在SWE-bench Verified测试中取得了78分,展现出极强的系统设计与复杂任务规划水准。
此前在OpenRouter平台上以Hunter Alpha代号进行盲测时,它的总调用量迅速登顶。
其中,OpenClaw贡献了675B Token的使用量,Kilo Code和Roo Code也分别达到了50.1B和38.6B Token,这些硬核的代码开发工具充分验证了它在生产环境中的极致可靠性。
为了检验实战水平,小米团队把它接入了OpenClaw框架进行前端开发测试。
只需要一段提示词它就能生成带有1990年代复古杂志风格的网页,无论是排版还是噪点滤镜都处理得非常到位。
MiMo-V2-Omni作为全模态模型,最大的亮点在于它把图像、视频和音频编码器融合进了一个主干网络里。
它能像人类一样同时看、听和读,并且可以直接把感知转化为行动。
在实际测试中,它能充当自动驾驶的视觉大脑提前预测潜在危险,还能作为智能体基模,完全自主地在浏览器里完成跨平台比价和购物,将各种工具调用和界面交互处理得游刃有余。
MiMo-V2-TTS则是一个专门给智能体赋予感情的语音模型。
只要直接用自然语言输入提示词,就能精确控制它的音色和情绪走向。
它不仅能根据上下文自动判断该用什么语气说话,还能特别自然地加入咳嗽、叹气或者笑声这些细节。
身份让龙虾之父也好奇
在谜底正式揭晓之前,Hunter Alpha和Healer Alpha的身份曾经引起了全球网友的广泛好奇。
它们亮相于3月11日,随后在OpenRouter上的调用量连续多日霸榜,总使用量迅速突破了1T Token。
就连龙虾之父Peter Steinberger也在X上发帖询问,有没有人知道这两款模型的具体细节。
有人猜是OpenAI,毕竟拿神秘模型在OpenRouter上试水已经是OpenAI的惯例了,而且命名习惯也很符合OpenAI的调性。
但考虑到Peter已经被OpenAI收编,不知道自家模型显得不是那么合理,当然也不排除OpenAI对内保密,或者Peter也在演戏的可能。
不过也有人从测试中发现,这个模型自称主要使用中文训练,因此可能来自中国,被猜测是DeepSeek-V4。
当然,也有在模型亮相早期就猜到这两款模型来自小米的,在3月14日就有网友在小红书上提及过这一传闻。
今晚,小米就要召开新的发布会了,在这个时间点公开模型身份,或许是在给新产品做铺垫。
如果你对小米的这三款新模型感兴趣,可以亲手试一下。
模型介绍:
https://mimo.xiaomi.com/mimo-v2-pro
https://mimo.xiaomi.com/mimo-v2-omni
https://mimo.xiaomi.com/mimo-v2-tts
热门跟贴