4月23日,小米MiMo V2.5系列模型开启公测。根据官方介绍,该系列模型具有更强的推理能力、更稳定的Agent。

另外,它还有多模态感知能力,不仅能看懂文本,还能理解图片、音频等信息。而且,在Artificial Analysis榜单中,Xiaomi MiMo-V2.5-Pro综合智能指数位列全球开源大模型第一。

打开网易新闻 查看精彩图片

(图源:小米)

既然小米这款大模型能力这么强,我们就来实际测试一下,看看它在哪些场景下有出色的表现,同时又有哪些要改进的地方。

MiMo V2.5实测:模型能力很强,联网检索稍弱

目前,MiMo V2.5系列已经开放公测,所有小米用户都能在MiMo官网直接体验MiMo V2.5、MiMo V2.5 Pro等模型产品。

网页端这种使用场景不能百分百发挥出大模型的潜力,但作为摸底考试来说问题不大。我们结合日常实际使用习惯,通过五个具体案例,来看看MiMo V2.5的真实实力。

案例一:文章总结

长文概括总结基本是当下主流大模型的基础能力,作为这次实测的开胃菜再合适不过了。

我们把雷科技(ID:leitech)最近写的一篇关于ChatGPT Images 2.0评测的图文内容链接丢给它分析, MiMo V2.5 Pro的反应很迅速,2秒钟就生成了结果。它对文章内容的概括非常准确,把文章中针对ChatGPT Images 2.0的优缺点评价都提炼了出来。

打开网易新闻 查看精彩图片

(图源:雷科技)

当然,这只是基本功,主流大模型一般都能比较好地完成这项任务,接下来我们就要加大力度了。

案例二:盘点一下小米2025年发布过的手机型号

这个问题主要考验的是MiMo-V2.5 Pro的信息联网检索能力,坦率说,它表现得比较一般。

首先,MiMo-V2.5 Pro罗列出的小米15系列是2024年发布的,并不是2025年的机型。

打开网易新闻 查看精彩图片

(图源:雷科技)

查看其信息来源后,我们发现它是被一篇博客文章误导了,这篇博文罗列了多款小米手机发布时间,但很多是错的,甚至很有可能本身也是AI生成的。

打开网易新闻 查看精彩图片

(显示错误信息的网页,图源:雷科技)

其次,不少机型被遗漏了,比如最重要的小米17系列。另外,它还出现了一些错误,MiMo-V2.5 Pro在检索了早期的爆料信息后,误以为小米15S Pro还没发布,但实际上它就是一款2025年发布的机型。

打开网易新闻 查看精彩图片

(图源:雷科技)

当然,围绕这个问题,其他大模型的表现也都很难称得上完美。公认联网搜索能力很强的Gemini 3.1 Pro就翻车了,它出现严重幻觉,居然虚构出了小米16系列。而DeepSeek反而是表现相对较好的,把小米和红米机型基本都盘点全了,还顾及到了很多大模型忽略的海外品牌POCO,当然它也遗漏了小米15S Pro。

打开网易新闻 查看精彩图片

(图源:雷科技)

案例三:去洗车店洗车应该走路去还是开车去?

这是之前非常经典的「忽悠」大模型的问题,曾经ChatGPT等知名模型都翻车了,它主要考验的就是模型本身的逻辑推理能力。一个在真人看来很简单的逻辑题,但对没有针对性做过训练的大模型来说,就很容易掉坑里。

面对这个问题,MiMo V2.5 Pro没有被绕进去,而是直接了当地指出了关键:要洗的是车,不是人,洗车的前提是车必须得过去。

打开网易新闻 查看精彩图片

(图源:雷科技)

案例四:帮我看看医院的检验报告

MiMo V2.5有一个重要亮点就是支持多模态,根据官方介绍,它在文本和代码之外,还支持图像、视频和语音(MiMo V2.5 Pro暂不支持)。所以,我们可以以图片等多媒体文件的形式进行输入。实际体验中,我找了一张医院检查的图片给它,MiMo V2.5很快识别出了是哪项检查,并且结合获取到的数据,给出了具体的结论和建议。

打开网易新闻 查看精彩图片

(图源:雷科技)

另外,普通的照片也能丢给它,比如我塞给它一张很模糊的、logo被遮挡的Switch图片,MiMo-V2.5准确识别出了它是Switch,并且表示是OLED版。

这项功能放在具体的终端设备上的话,可以进一步拓展使用场景,比如手机打开相机就能把画面实时交给AI分析、导航时根据相机识别出用户所在的精准坐标等。

打开网易新闻 查看精彩图片

(图源:雷科技)

案例五:做一个浏览器能运行的小游戏

一直以来,大模型的代码能力都很被看重。作为一个编程小白,我更关心的是它能不能根据我的需求生成一个能直接运行的程序,不用再做任何额外的工作。

首先,我提了一个基础编程课上的简单案例:生成一个解一元二次方程的程序。MiMo-V2.5 Pro很快就开始写代码了,马上做出了一个可以在浏览器上直接运行的HTML文件。我只要在程序界面填入对应的数字,它就能算出结果。

打开网易新闻 查看精彩图片

(图源:雷科技)

然后,我们加大了难度,让它写一个围棋的程序,它的代码更加复杂,还要围绕UI设计做很多工作。MiMo-V2.5 Pro处理这项任务也毫无压力,将它生成的代码直接运行,就能在围棋程序里面下棋了。

打开网易新闻 查看精彩图片

(图源:雷科技)

MiMo Claw来了,小米「龙虾」好用吗?

伴随着MiMo-V2.5系列的发布,小米还同步上线了MiMo Claw。不过,这款龙虾目前还处于测试阶段,通过在网页端运行的模式提供给用户使用。

它的单次体验限时1小时,超时后原有的数据会被销毁,用户可以重新创建一个Claw项目再次体验。我们通过新闻抓取、财报分析和文档优化三个场景来测试这款龙虾的实际表现。

场景一:新闻抓取

我给MiMo Claw出了一个不大不小的难题:搜索当天的科技要闻,并且按照指定的怀旧风格生成一张海报。这主要考验它的两个能力,一是信息检索,二是作图。

从实测结果来看,作为一款还在公测的「龙虾」,它的表现还可以,至少模仿90年代杂志风格这方面做得挺不错的,而且排版基本没出现大问题。

当然,还是老问题,它的信息联网检索能力一般,搜集了一些旧闻,时效性差点意思。但整体来说,这个效果已经很好了,效率也比人工高。

打开网易新闻 查看精彩图片

(图源:雷科技)

场景二:财报分析

很多海外大公司发布的财报文件,篇幅很长、数据很多,而且基本是英文,国内投资者要看懂看透,难度不小。我们尝试把一份28页的苹果财报PDF文件丢给MiMo Claw,让它来分析和总结。

打开网易新闻 查看精彩图片

(图源:雷科技)

MiMo Claw的表现很给力,比较精准地概括了这份财报数据的重点,并且给出了结论:

1. iPhone 是绝对功臣
2. 研发投入暴增31.7%
3. 服务业务稳健增长但增速放缓
4. Mac和可穿戴拖后腿
5. 现金流极其充沛

打开网易新闻 查看精彩图片

(图源:雷科技)

在查看MiMo Claw的工作流时,我们发现,它首先会把PDF文件中的文本信息全部提取出来,在云端以TXT文件保存,再将这份文档进行翻译、分析,最后归纳总结。不过,由于它是基于网页端运行的,所以实际体验没能和主流的网页端大模型拉开很大的差距。

场景三:文档优化

对于MiMo Claw的能力,小米官方提到了它与金山生态达成了合作,在Office文档处理方面会有优势。我个人一直都是PPT苦手,难点不在于内容填充,主要是排版。毕竟,PPT给人的第一印象往往是由版面美观度决定的。

为了「拷打」MiMo Claw,我特意找了个排版风格非常陈旧的大学课件,这个PPT一打开,完全是90年代的风格,而且毫无排版设计可言。

打开网易新闻 查看精彩图片

(图源:雷科技)

我们将这个PPT喂给MiMo Claw,并且要求它着重美化排版,具体参考科技公司的Keynote。坦率说,我对最后的成品没有抱太多期待,主要是因为PPT美化的难度比纯粹修改文本高很多,需要龙虾工具在模型、智能体和Skills方面都有很强的能力。

然后,从MiMo Claw最后生成的PPT文件来看,整体排版效果好了非常多,至少字体颜色比原版正常很多,看着更舒服。别的不说,原版PPT那种陈旧毫无美观度可言的版面,总算消失了。

打开网易新闻 查看精彩图片

(图源:雷科技)

终端品牌入局大模型,小米有长远打算

由于还在公测阶段,MiMo-V2.5系列大模型以及MiMo Claw在实际使用中自然还会存在一些问题,但我们已经能感受它较为出色的模型和Agent能力。

同时,这次的大规模公测,大量用户的实测和反馈,也能给小米提供一些改进的方向。从小米的规划来看,MiMo-V2.5系列不仅面向普通用户,更面向广大开发者。伴随这次公测,小米MiMo-V2.5系列的Token付费服务也一并上线。

当然,我们也认为,对于小米而言,不遗余力地迭代大模型,绝不仅仅是为了在发布会上秀技术肌肉和赚点服务费,其真正的野心在于深度赋能旗下庞大的消费核心业务。

就拿我们最熟悉的小爱同学来说,如果融入MiMo-V2.5系列的全模态能力,它将迎来一次跨越式的进化。固有印象中的小爱同学,更多是一个被动的指令执行工具,用户发号施令,它按部就班地开关电器或是定闹钟。

但在全模态大模型的加持下,它正在转型成为一位真正的超级管家。它不仅能直接看懂用户手机或平板屏幕上的内容并进行深度交互,更能敏锐地听懂家庭场景中那些模糊的自然语言,理解背后复杂的真实意图。

打开网易新闻 查看精彩图片

(图源:小米)

小米自家的AI技术,不仅能应用到手机这类单品中,还能广泛融入小米的「人车家」生态中,为更多产品、更多应用场景提供支持。可以预见的是,小米未来的产品蓝图肯定不局限于智能家居和汽车,还将包括人形机器人、其他形式的AI硬件等。

可以说,如今的大模型已经彻底跳出了发布会上那些干巴巴跑分和技术指标,成长为真正打通并盘活各种智能场景生态的核心大脑。从更行业视角来看,这不仅是小米一家的战略,更是整个智能终端赛道的共识。

小米正依托大模型不断深化其人车家全生态,而荣耀等厂商也在掌舵人李建的带领下,加速推进底层AI的全面重构,荣耀的人形机器人刚在马拉松赛道上夺冠,就是这一证明。这标志着曾经单纯卷硬件参数的手机厂商们,都在默契地跨越传统的边界,从终端硬件品牌全面向AI生态品牌转型。

2026第十九届北京国际汽车展览会将于4月24日至5月3日在北京‌中国国际展览中心(顺义馆)和首都国际会展中心(新国展二期)举行,本届车展以“领时代·智未来”为主题,集中展现汽车工业的更多黑科技。
比亚迪、小米、鸿蒙智行(问界等)、小鹏、蔚来、岚图等头部品牌集结,多款重磅新车首秀;地平线、Momenta、卓驭等供应商集体秀肌肉,AI大模型深度赋能,高阶智驾、动力电池、超快充技术等前沿科技集中亮相,看点拉满!
雷科技旗下「电车通」将派出报道团直击现场,以“关注电动车,更懂智能化”的专业视角,带来一线独家报道,敬请关注!

打开网易新闻 查看精彩图片