1995年,微软内部搞过一次颇具乌托邦色彩的尝试。当时的Windows系统操作太复杂,团队想把电脑桌面做成普通人看得懂的"房间"——想打字就点桌上的笔记本,想看时间就点墙上的挂钟,不用思考那些反直觉的操作路径。

这个产品叫Microsoft Bob,上市没多久就光速下架。原因五花八门,但究其根本:它没真正渗透进系统底层,用户需求稍微复杂一点,就只能无能为力。

打开网易新闻 查看精彩图片

三十年后,很多AI助手依然没有完全走出这个困境。最近我体验到了腾讯新的AI助手Marvis马维斯,终于看到了一些不同。

相比于别人都在卷谁是AI聊天机器人,Marvis想干的是直接把整台电脑变成你可以随意使唤的搭档。官方给它的定位也正儿八经,叫"操作系统层级的个人AI助手"。不过,当我知道它背后是那个做了14年应用宝的团队时,就不觉得意外了——这种长期在PC和移动端底层生态里打拼的出身,恰恰意味着它不仅懂AI,更懂设备和系统。

目前,Marvis已率先覆盖Windows PC与Android手机端,iOS和macOS版本也在推进中。

六个Agent,一支随时待命的私人AI团队

安装过程不算复杂,但对设备有点要求。Windows端最低门槛是8核CPU、16GB内存加上固态硬盘。而且据官方透露,未来还会逐步兼容6核。

市面上很多Agent产品动辄让用户自己去搭工作流、安插件,Marvis则是开箱即用,六个Agent零配置上手,对普通用户非常友好。刚进界面,里面已经有六个Agent在7×24小时待命了。

六个Agent都有自己的"工位"。没接到任务的时候,有的在打盹,有的在办公室里闲逛,有的在健身,有的在喝咖啡,还有一个直接去上厕所——一旦你发出指令,任务就会拆解分配给对应的成员。

这是一个分工明确的团队:PM负责听懂你的需求,拆解任务往下派活;File Agent处理文件的搜索、阅读和格式转换;Computer Agent专门对付系统配置、查硬件、调夜间模式;APP Agent负责在各种软件里代为操作,比如查个机票或者电商比价;Search Agent负责快速从公开资源中定位答案并给出关键引用;最后是个Browser Agent,定位是网页交互专家,进行网页交互与数据抓取。

任务链比较长的时候,看看这些动画也是别有一番趣味。

最有意思的是,这些Agent可以并行工作。举例而言,我先抛出一个需求:"电脑开机太慢了,帮我看看哪些自启动程序没用,帮我关掉。"

注意看,界面上还会实时显示字符消耗量,其实也就是Token消耗量,每天的免费额度是2000万Token。

结果显示,它给每个程序配了"人话版"说明,建议你哪些是可以按需、保留的第三方软件。重点是,涉及这种核心配置修改的操作,它会主动和你确认一下,才会执行。这种"AI不会自作主张"的机制,稳得让人心安。

电脑用久了,总会碰到几个反复折磨人的小问题。"查看电池健康状况""网速感觉变慢了,帮我测一下现在的上传下载和延迟。""想玩个新游戏,帮我检测一下硬件配置,对比最低要求看看差在哪。"

以前遇到这些事,要么去开始菜单里找设置,要么去网上搜教程。现在,说一句话就行了。

Marvis深度对接了系统信息和配置入口。它能看到硬件参数,也能直接修改系统设置。它不是帮你打开"控制面板"然后让你自己找,而是直接把事情办了。对于那些不熟悉电脑设置的人来说,这块的体验是最直观的。

举个例子:你想关掉Windows锁屏上的广告,你知道它在设置里叫什么吗?叫"关闭Windows聚焦",有多少用户知道这个术语是关广告的?但Marvis能帮你一句话关掉。

本地文件时代,迎来AI入口

为了测它的能力,我还翻出了一件困扰已久的事:两个月前从某个群里下载的一张截图,只记得内容是关于《黑神话:悟空》,文件名完全忘了。

我输入:"帮我找一下关于《黑神话:悟空》的图片或截图,大概是一个月前的事儿。"说实话我没抱太大希望。

但Marvis接单后,首先根据Skill指引,按文件名关键词和时间范围筛选出1000张照片,然后用Python快速筛选整个结果文件,并最终找到8张候选图。第一张正是我要找的那张。

而且它的搜索范围极其宽泛:文件名、文档内容、图片里的景、截图里的字,全覆盖。哪怕描述模糊,它也都能捞出来。这个能力,比Windows自带的搜索确实强出了一大截。

当然,一听到"扫描图片",可能会有人担心隐私。首次使用时你可以自己设定扫描范围。如果在生成的图谱里看到不想被索引的内容,右键一键屏蔽即可。而且端侧模型本身自带基础过滤,不是无差别的扫描。

除了找文件,Marvis还能对本地的文档、表格等多种类型文件做深度理解和分析——支持内容优化、图表生成、文案润色、格式转换,帮原本费时费力的事情变得顺手。

比方说,下载了一批学术论文,摞在那里不知道从哪里读起。直接问Marvis:"扫一遍这几篇PDF,告诉我每篇的研究问题、方法和主要结论。"几分钟内,哪几篇值得细读、哪几篇可以先放着,心里就有数了,不用一篇一篇翻摘要。

再比如读完《三体》,笔记记了好几页,马上要在课上分享,手动整理提纲、挑内容、套PPT模板,少说也要折腾一两个小时。但让Marvis根据读书笔记,生成一份PPT,它能读懂笔记里的逻辑和层次,不需要手动复制粘贴再套模板,理解内容之后直接生成。

手机接管电脑,随时随地都能干活

手机遥控操作电脑,则是非常实用的跨端体验。去官网下了Windows客户端,再给手机安上Marvis App,用同一个微信或QQ登录,还能直接连通两端。

具体来说,手机App连上电脑后,可以在手机上实时看到电脑桌面,并用触屏直接操控。哪怕电脑处于锁屏状态,手机依然可以接管,不需要电脑一直保持解锁状态。

比如我人在外面,突然听到朋友说前阵子新出了一款《洛克王国:世界》游戏,这时我就可以掏出手机输入:帮我在电脑上安装《洛克王国:世界》,回到家就能玩上了。

连接微信ClawBot,也是没问题的,微信扫码登录后就能开启对话。

但我认为最实用的场景,是给家里长辈远程排查电脑问题。爸妈说"QQ打不开了",以前要么电话里盲猜,要么回家处理。现在直接接管他们的桌面,扫一眼就知道问题出在哪。前提是你的手机端Marvis马维斯,要能连接爸妈家里的电脑端马维斯,手机端是支持连接多个PC设备的。

而如果电脑断网了,手机端会自动切到云Marvis模式,支持独立调用云端能力,大部分任务依然能跑。并且这里还有一个独家绝活:在电脑上直接操控手机里的App。同花顺、飞常准等应用已经在对接合作,这也得益于应用宝团队多年的跨端引擎积累。现在应用宝在移动端、PC端、车载上都有支持,跨端研发经验充足。

和其他桌面Agent一样,Marvis也支持自定义自动任务。