打开网易新闻 查看精彩图片

我的电脑上养着一个"高级实习生",名字叫Marvis。

说它高级,是因为一个多月前我随手扔给它一套指令:让它每天自动爬取AI行业新闻,分国内国外两个版本,按几个板块归类,最后输出成带标题、来源、链接的Word文档。我设完就没怎么管了,偶尔打开看看,别的AI抓的新闻信息量不够、选题不够细的时候,拿它做补充。平心而论,它整理的日报确实比别的AI细一点,这份"高级"我认。

说它实习生,是因为它犯错的姿势太像人了。前天我照例打开它,想补一份日报。它当天自动生成的两份日报已经躺在那儿了,汇报"编码验证通过"。我点开一看,满屏乱码。

我让它再跑一次,Marvis自己说:"让我验证一下编码是否正常,确保没有乱码。"检查完又说"已验证无乱码,结构清晰",但预览还是乱码。

“错了吗?”“错了,下次还犯”。

我说今天已经2次乱码了。它说"现在用正确的ID重新生成",第三次输出,还是乱码。

直到第四次,终于正常了。这次它才给出根因分析:aihot API返回的JSON数据在PowerShell写入文件时发生了Latin-1误编码,导致中文字段变成乱码。它已经通过"Latin-1误编码→UTF-8解码"的流程彻底修复。

理论基础扎实,动手能力堪忧。这也是为什么我不把它当成最优来源的原因。这一个多月来,我打开它的次数不算少,平时碰到乱码,再输出一次通常就好了,没太当回事。但这次三连翻车确实把我惹毛了,决定回来看看它这一个多月到底进步了多少。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

其实现在co-work产品有很多,但测来测去,我发现只有Marvis是有机会“转正”的。结尾我来给大家解释为什么。

一个多月前我给它做过一次测评,结论是"高级实习生":能扛脏活累活,但时间幻觉严重、频繁确认打断工作流。如果你没看过那篇,可以戳这里马维斯(Marvis)实测:他给了我一些可以独处的时间。

老病复查

先过时间这条。一个多月前,我给它设"20分钟后的闹钟",它能把时间算错;设"10分钟前的闹钟",它傻乎乎地执行;跨午夜的任务,日期经常错乱。

这次回来,三条指令丢过去。

"帮我设一个20分钟后的闹钟,提醒我去开会。"它回复:当前时间17:51:51,20分钟后是18:11:51。到点,准时响起。

"帮我设一个今晚23点55分的闹钟。"它正确识别"今晚"就是今天,没有设成昨晚或明天。

陷阱题:"帮我设一个10分钟前的闹钟。"这次它没有执行,而是明确拒绝:"10分钟前的时间点已经过去了,定时任务无法设置为过去的时间。"

打开网易新闻 查看精彩图片

基础时间计算,确实修好了。过去时间陷阱、跨午夜日期、短周期计算,全部正确。

打开网易新闻 查看精彩图片

但定时任务有个隐藏前提:电脑得保持开机,客户端得在运行。我设了一个2小时后的任务,19:51在桌面新建一个txt文件。到点,桌面没文件。进Marvis的"自动任务"管理页面一看,状态显示"已过期",详情里一行小字:"由于电脑休眠、关机或其他异常情况,任务执行失败。"当时我出去吃了个饭,电脑休眠了。Marvis不会唤醒电脑,也不会在失败后主动告诉我,而是默默在任务管理页面里记一笔记录,等我哪天想起来查才发现。

后来又设了22:00的任务:打开浏览器搜索新闻,保存前3条标题。这次我在电脑前,准时执行,桌面出现"新闻-今晚测试.txt"。

打开网易新闻 查看精彩图片

次日15:00的整理任务也准时自动执行,筛选、新建、压缩一气呵成。

所以定时任务的现状是:时间算对了,执行也准了,但电脑一休眠它就静默失败,而且不会主动通知你。说白了,赛博监工不能离线值班,旷工了还不主动请假。如果你指望它凌晨自动备份或者定时爬虫,睡醒后发现任务挂了且没有任何报警,数据丢了都不知道,这坑比"时间算错"更隐蔽。

打开网易新闻 查看精彩图片

再说批量操作。5月测评时,这是最痛的点。删10张图确认10次,效率归零。

这次直接上强度。我桌面上原本有个"AI唱反调"文件夹,里面攒了50多个子文件夹,全是之前写的稿子和插图,Word、图片混在一块,总共473个文件。我怕测坏了原文件,复制了一份,改名"测试"文件夹,专门用来折腾它。

为了测它在异常环境下的表现,我还故意埋了三个雷:

找了一份Word文档,右键属性勾了"只读" 开了一张图片用WPS占着 新建了一个叫测试@#$%^&.txt的文件,专门测特殊字符处理

打开网易新闻 查看精彩图片

指令发过去:

帮我整理桌面"测试"文件夹:扫描里面所有文件,按类型分类,每个类型新建子文件夹放进去;检测重复文件,只保留一份,其他的删除;把所有图片文件按"2026-07-04-01"这种格式批量重命名;把整理后的整个文件夹压缩成一个zip,命名为"测试备份-2026-07-04";把这个zip移动到D盘根目录。

Marvis扫描完,发现是嵌套结构,先问我要不要拆解子文件夹。我确认后,它开始执行。中间检测到7组"同大小"文件,弹出确认框问要不要删除重复。我纠正说"这不是重复,是不同版本",它取消删除,继续执行。

打开网易新闻 查看精彩图片

242张图片批量重命名,全程没有逐张弹窗确认。最后压缩打包366MB,成功移动到D盘根目录。速度很快,仅弹出1次去重确认,无逐次弹窗。

打开网易新闻 查看精彩图片

批量操作流畅度比5月有质的飞跃。但去重逻辑是按"同大小"判断,它不会区分"重复备份"和"版本迭代",用的时候需要在指令里提前把条件写死。

打开网易新闻 查看精彩图片

加码深挖

基础病复查完,看看它能不能干更重的活儿。

我准备了四份素材:一份Word会议纪要(AI_Agent_Meeting_Pro.docx),一份PDF行业报告(AI_Agent_Report_Pro.pdf,12页),一份Excel数据表(AI_Agent_Tracking_Pro.xlsx,4个Sheet),还有一张之前那篇首测文章里截的Marvis界面图(AI图.png)。

打开网易新闻 查看精彩图片

指令发过去:读取这四份文件,提取核心观点,整合成Markdown简报,分"技术动态""产品发布""资本动态""行业观点"四个板块。

1分钟后,简报生成。文件读取情况:docx已读取,pdf已读取,xlsx已读取(4个Sheet:市场概览、融资追踪、产品追踪、学术会议),截图因为文件名空格问题识别为"文件不存在"。我纠正说"AI图.png中间有空格",它重新读取,更新简报,把截图内容纳入"产品发布"板块,并删除底部"AI图.png不存在"的旧注释。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

简报里的数据全部准确,没有脑补。 Anthropic H轮65亿美元、估值9650亿、字节豆包68元/月、快手可灵ARR约5亿美元,这些数字都对得上原文。

但这还不是最意外的。简报生成后,我连续聊了5轮别的:问明天北京天气、推荐悬疑电影、算复利、秦始皇和汉武帝在位时间、形容夏天吃西瓜。

然后突然问:"回到刚才那份AI Agent简报,第二个板块'产品发布'里提到的第一个产品是什么?请基于最初那份PDF文档的第三页内容,详细展开说明,不要脑补,只引用原文。"

它的回复:先指出"PDF第三页是核心发现摘要,没有产品发布的具体产品",然后准确说出简报里"产品发布"首条是"字节豆包专业版",并纠正我"实际在PDF第七页",完整复述原文。

打开网易新闻 查看精彩图片

5轮闲聊后它没失忆,没瞎编,还能纠正用户的页码错误。这比5月测评时的"金鱼记忆"强太多了。想必是腾讯在上下文上下了大功夫。

其他的新增功能我也快速摸了一圈。

手机端语音输入:按住麦克风说"用手机连接电脑,帮我在电脑桌面新建一个文件夹,命名为手机远程",识别准确,执行成功,桌面准时出现文件夹。Windows电脑端暂未找到语音入口,目前语音输入仅限手机端。

打开网易新闻 查看精彩图片

跨端协同:安卓手机连接Windows桌面,秒级派发file-agent(简单说就是手机端向电脑端派遣一个专门处理文件的代理程序),远程新建文件夹成功。连接顺畅,无明显延迟。手机能当遥控器。

低资源占用模式:切换到该模式后,让它在桌面新建文件夹、复制图片、压缩成zip。虽然桌面根目录只找到1张符合条件的图片,但全流程完整执行,无弹窗、无报错。同一份整理任务,正常模式耗时约8分钟,低资源模式约10分钟,耗时增加约25%,但功能无阉割。老旧电脑用户可以放心开这个模式。

小结:多源整合能力质变,1分钟出简报且数据保真;长上下文记忆惊艳,5轮闲聊后仍能纠正页码错误;新增的手机跨端和低资源模式都能用,但语音输入仅限手机端。

竞品对比

同样的需求,我拿去测了豆包和Kimi Work。

豆包能读取桌面文件,识别出536个文件,分类统计准确。但执行到写入阶段,它提示"桌面文件夹有权限限制",转而创建了一个新的"测试_整理后"文件夹,在豆包自己的工作目录里完成整理,最后给了一个下载链接,让用户手动下载或授权后移动。

打开网易新闻 查看精彩图片

Kimi Work也能读取桌面,识别出474个文件,分类整理、242张图批量重命名、打包压缩全部完成,生成367MB的zip。但整理结果保存在Kimi自己的工作目录,最后给了一段PowerShell脚本,让用户自己运行来替换桌面原文件夹。

打开网易新闻 查看精彩图片

三家都能读本地文件,但写出来的位置完全不同。Marvis直接写回桌面和D盘,一步到位。豆包放在沙盒里,给下载链接。Kimi Work放在工作目录,给PowerShell脚本让你自己跑。

打个比方:Marvis是住家保姆,直接在你家客厅干活;豆包是远程外包,整理好的文件打包放快递柜让你自己取;Kimi是技术顾问,把操作步骤写给你,让你自己动手搬。

不过Kimi Work的系统级文件操作已经能做同样的事,虽然免费版有限额,高频需付费。豆包也在快速迭代。Marvis的"原地操作"优势,目前靠免费守着,后续怎么定价还得看腾讯。

打开网易新闻 查看精彩图片

小结:三家都能读本地文件,但Marvis是唯一免费就能原地操作的。豆包和Kimi Work本质是安全兜底,不是技术上做不到,是产品哲学不同。Marvis的窗口期靠"免费+直接"守着。

前置提醒:Marvis拥有文件删除、移动、修改的系统权限,重要文件操作前务必备份;涉及批量删除的指令,建议先在测试文件夹验证,避免误删。它的去重逻辑并不智能,不要在原始素材上直接跑去重。

放心交给它的任务

桌面文件批量整理:50个以上文件、混合格式、跨盘移动,全程流畅,确认弹窗极少 定时信息收集:只要电脑不休眠、不锁屏、客户端不退出,它准时执行,输出稳定 多源文档整合:3到5份不同格式(PDF/Word/Excel/截图)整合成简报,1分钟出稿,信息保真 手机远程操控:安卓连Windows桌面,秒级响应,能当应急遥控器。

建议绕行的场景

电脑休眠/锁屏/关机时的定时任务:静默失败,无任何提醒,仅在任务列表留记录 复杂去重:它按"同大小"判断,容易把版本迭代当重复删,去重指令必须写死"同大小但内容不同的保留" 模糊条件整理:你说"把测试相关文件收拾一下",它只会找文件名含"测试"的,指令必须给明确限定词

万能指令口诀

批量操作前加:接下来是批量操作,同类操作无需逐次确认。

去重操作前加:同大小但内容不同的文件是版本迭代,不是重复,全部保留。

定时任务前加:若执行时电脑休眠,恢复后请自动重试并通知我。

结语

先给最终答案:能转正,但只能转"带条件的正式岗"。给足明确指令、保证电脑开机不锁屏,它能稳定输出基础工作;但别指望它主动汇报异常、自己解决意外状况。

一个多月前,我给Marvis的评语是"高级实习生",能扛脏活累活,但时间幻觉、频繁确认。

一个月后回来复查:时间计算治好了,批量操作流畅了,多源整合和长记忆惊艳了。定时任务现在准了,但有个前提,电脑不能休眠,休眠了任务会静默失败,而且不会主动通知你。新增的手机跨端能用,低资源模式不阉割。

它没有脱胎换骨,但进步很明显。从"经常犯错的实习生"变成了"能独立干活但有前提条件的正式员工"。这个前提条件,就是电脑得开着,指令得写清楚。

另外,它一定程度上让我摆脱了手机办公的痛点。电脑上有AI办公远比自己扣着手机找工具要强多了,只是睡眠期间干活这种指令要写进去,云服务器操作可能是唯一路径,这是这对厂商来说又是一笔成本。

对于Windows端用户,它目前仍是唯一免费就能直接操作系统文件的AI。这份原地操作的能力,在竞品还在远程助理阶段时,足够撑起日常效率。但前提是,你得知道它的边界在哪,什么时候该用,什么时候该绕过。

再好的工具,也得靠主人懂行,才能榨出最大价值。