我们拷打了小米最新大模型：全模态很惊艳，但联网检索仍是短板|mimo|大模型|小米集团|模态|联网检索

4月23日，小米MiMo V2.5系列模型开启公测。根据官方介绍，该系列模型具有更强的推理能力、更稳定的Agent。

另外，它还有多模态感知能力，不仅能看懂文本，还能理解图片、音频等信息。而且，在Artificial Analysis榜单中，Xiaomi MiMo-V2.5-Pro综合智能指数位列全球开源大模型第一。

（图源：小米）

既然小米这款大模型能力这么强，我们就来实际测试一下，看看它在哪些场景下有出色的表现，同时又有哪些要改进的地方。

MiMo V2.5实测：模型能力很强，联网检索稍弱

目前，MiMo V2.5系列已经开放公测，所有小米用户都能在MiMo官网直接体验MiMo V2.5、MiMo V2.5 Pro等模型产品。

网页端这种使用场景不能百分百发挥出大模型的潜力，但作为摸底考试来说问题不大。我们结合日常实际使用习惯，通过五个具体案例，来看看MiMo V2.5的真实实力。

案例一：文章总结

长文概括总结基本是当下主流大模型的基础能力，作为这次实测的开胃菜再合适不过了。

我们把雷科技（ID：leitech）最近写的一篇关于ChatGPT Images 2.0评测的图文内容链接丢给它分析， MiMo V2.5 Pro的反应很迅速，2秒钟就生成了结果。它对文章内容的概括非常准确，把文章中针对ChatGPT Images 2.0的优缺点评价都提炼了出来。

（图源：雷科技）

当然，这只是基本功，主流大模型一般都能比较好地完成这项任务，接下来我们就要加大力度了。

案例二：盘点一下小米2025年发布过的手机型号

这个问题主要考验的是MiMo-V2.5 Pro的信息联网检索能力，坦率说，它表现得比较一般。

首先，MiMo-V2.5 Pro罗列出的小米15系列是2024年发布的，并不是2025年的机型。

（图源：雷科技）

查看其信息来源后，我们发现它是被一篇博客文章误导了，这篇博文罗列了多款小米手机发布时间，但很多是错的，甚至很有可能本身也是AI生成的。

（显示错误信息的网页，图源：雷科技）

其次，不少机型被遗漏了，比如最重要的小米17系列。另外，它还出现了一些错误，MiMo-V2.5 Pro在检索了早期的爆料信息后，误以为小米15S Pro还没发布，但实际上它就是一款2025年发布的机型。

（图源：雷科技）

当然，围绕这个问题，其他大模型的表现也都很难称得上完美。公认联网搜索能力很强的Gemini 3.1 Pro就翻车了，它出现严重幻觉，居然虚构出了小米16系列。而DeepSeek反而是表现相对较好的，把小米和红米机型基本都盘点全了，还顾及到了很多大模型忽略的海外品牌POCO，当然它也遗漏了小米15S Pro。

（图源：雷科技）

案例三：去洗车店洗车应该走路去还是开车去？

这是之前非常经典的「忽悠」大模型的问题，曾经ChatGPT等知名模型都翻车了，它主要考验的就是模型本身的逻辑推理能力。一个在真人看来很简单的逻辑题，但对没有针对性做过训练的大模型来说，就很容易掉坑里。

面对这个问题，MiMo V2.5 Pro没有被绕进去，而是直接了当地指出了关键：要洗的是车，不是人，洗车的前提是车必须得过去。

（图源：雷科技）

案例四：帮我看看医院的检验报告

MiMo V2.5有一个重要亮点就是支持多模态，根据官方介绍，它在文本和代码之外，还支持图像、视频和语音（MiMo V2.5 Pro暂不支持）。所以，我们可以以图片等多媒体文件的形式进行输入。实际体验中，我找了一张医院检查的图片给它，MiMo V2.5很快识别出了是哪项检查，并且结合获取到的数据，给出了具体的结论和建议。

（图源：雷科技）

另外，普通的照片也能丢给它，比如我塞给它一张很模糊的、logo被遮挡的Switch图片，MiMo-V2.5准确识别出了它是Switch，并且表示是OLED版。

这项功能放在具体的终端设备上的话，可以进一步拓展使用场景，比如手机打开相机就能把画面实时交给AI分析、导航时根据相机识别出用户所在的精准坐标等。

（图源：雷科技）

案例五：做一个浏览器能运行的小游戏

一直以来，大模型的代码能力都很被看重。作为一个编程小白，我更关心的是它能不能根据我的需求生成一个能直接运行的程序，不用再做任何额外的工作。

首先，我提了一个基础编程课上的简单案例：生成一个解一元二次方程的程序。MiMo-V2.5 Pro很快就开始写代码了，马上做出了一个可以在浏览器上直接运行的HTML文件。我只要在程序界面填入对应的数字，它就能算出结果。

（图源：雷科技）

然后，我们加大了难度，让它写一个围棋的程序，它的代码更加复杂，还要围绕UI设计做很多工作。MiMo-V2.5 Pro处理这项任务也毫无压力，将它生成的代码直接运行，就能在围棋程序里面下棋了。

（图源：雷科技）

MiMo Claw来了，小米「龙虾」好用吗？

伴随着MiMo-V2.5系列的发布，小米还同步上线了MiMo Claw。不过，这款龙虾目前还处于测试阶段，通过在网页端运行的模式提供给用户使用。

它的单次体验限时1小时，超时后原有的数据会被销毁，用户可以重新创建一个Claw项目再次体验。我们通过新闻抓取、财报分析和文档优化三个场景来测试这款龙虾的实际表现。

场景一：新闻抓取

我给MiMo Claw出了一个不大不小的难题：搜索当天的科技要闻，并且按照指定的怀旧风格生成一张海报。这主要考验它的两个能力，一是信息检索，二是作图。

从实测结果来看，作为一款还在公测的「龙虾」，它的表现还可以，至少模仿90年代杂志风格这方面做得挺不错的，而且排版基本没出现大问题。

当然，还是老问题，它的信息联网检索能力一般，搜集了一些旧闻，时效性差点意思。但整体来说，这个效果已经很好了，效率也比人工高。

（图源：雷科技）

场景二：财报分析

很多海外大公司发布的财报文件，篇幅很长、数据很多，而且基本是英文，国内投资者要看懂看透，难度不小。我们尝试把一份28页的苹果财报PDF文件丢给MiMo Claw，让它来分析和总结。

（图源：雷科技）

MiMo Claw的表现很给力，比较精准地概括了这份财报数据的重点，并且给出了结论：

1. iPhone 是绝对功臣
2. 研发投入暴增31.7%
3. 服务业务稳健增长但增速放缓
4. Mac和可穿戴拖后腿
5. 现金流极其充沛

（图源：雷科技）

在查看MiMo Claw的工作流时，我们发现，它首先会把PDF文件中的文本信息全部提取出来，在云端以TXT文件保存，再将这份文档进行翻译、分析，最后归纳总结。不过，由于它是基于网页端运行的，所以实际体验没能和主流的网页端大模型拉开很大的差距。

场景三：文档优化

对于MiMo Claw的能力，小米官方提到了它与金山生态达成了合作，在Office文档处理方面会有优势。我个人一直都是PPT苦手，难点不在于内容填充，主要是排版。毕竟，PPT给人的第一印象往往是由版面美观度决定的。

为了「拷打」MiMo Claw，我特意找了个排版风格非常陈旧的大学课件，这个PPT一打开，完全是90年代的风格，而且毫无排版设计可言。

（图源：雷科技）

我们将这个PPT喂给MiMo Claw，并且要求它着重美化排版，具体参考科技公司的Keynote。坦率说，我对最后的成品没有抱太多期待，主要是因为PPT美化的难度比纯粹修改文本高很多，需要龙虾工具在模型、智能体和Skills方面都有很强的能力。

然后，从MiMo Claw最后生成的PPT文件来看，整体排版效果好了非常多，至少字体颜色比原版正常很多，看着更舒服。别的不说，原版PPT那种陈旧毫无美观度可言的版面，总算消失了。

（图源：雷科技）

终端品牌入局大模型，小米有长远打算

由于还在公测阶段，MiMo-V2.5系列大模型以及MiMo Claw在实际使用中自然还会存在一些问题，但我们已经能感受它较为出色的模型和Agent能力。

同时，这次的大规模公测，大量用户的实测和反馈，也能给小米提供一些改进的方向。从小米的规划来看，MiMo-V2.5系列不仅面向普通用户，更面向广大开发者。伴随这次公测，小米MiMo-V2.5系列的Token付费服务也一并上线。

当然，我们也认为，对于小米而言，不遗余力地迭代大模型，绝不仅仅是为了在发布会上秀技术肌肉和赚点服务费，其真正的野心在于深度赋能旗下庞大的消费核心业务。

就拿我们最熟悉的小爱同学来说，如果融入MiMo-V2.5系列的全模态能力，它将迎来一次跨越式的进化。固有印象中的小爱同学，更多是一个被动的指令执行工具，用户发号施令，它按部就班地开关电器或是定闹钟。

但在全模态大模型的加持下，它正在转型成为一位真正的超级管家。它不仅能直接看懂用户手机或平板屏幕上的内容并进行深度交互，更能敏锐地听懂家庭场景中那些模糊的自然语言，理解背后复杂的真实意图。

（图源：小米）

小米自家的AI技术，不仅能应用到手机这类单品中，还能广泛融入小米的「人车家」生态中，为更多产品、更多应用场景提供支持。可以预见的是，小米未来的产品蓝图肯定不局限于智能家居和汽车，还将包括人形机器人、其他形式的AI硬件等。

可以说，如今的大模型已经彻底跳出了发布会上那些干巴巴跑分和技术指标，成长为真正打通并盘活各种智能场景生态的核心大脑。从更行业视角来看，这不仅是小米一家的战略，更是整个智能终端赛道的共识。

小米正依托大模型不断深化其人车家全生态，而荣耀等厂商也在掌舵人李建的带领下，加速推进底层AI的全面重构，荣耀的人形机器人刚在马拉松赛道上夺冠，就是这一证明。这标志着曾经单纯卷硬件参数的手机厂商们，都在默契地跨越传统的边界，从终端硬件品牌全面向AI生态品牌转型。

2026第十九届北京国际汽车展览会将于4月24日至5月3日在北京‌中国国际展览中心（顺义馆）和首都国际会展中心（新国展二期）举行，本届车展以“领时代·智未来”为主题，集中展现汽车工业的更多黑科技。
比亚迪、小米、鸿蒙智行（问界等）、小鹏、蔚来、岚图等头部品牌集结，多款重磅新车首秀；地平线、Momenta、卓驭等供应商集体秀肌肉，AI大模型深度赋能，高阶智驾、动力电池、超快充技术等前沿科技集中亮相，看点拉满！
雷科技旗下「电车通」将派出报道团直击现场，以“关注电动车，更懂智能化”的专业视角，带来一线独家报道，敬请关注！