MiniMax Agent 今天更新了桌面端,核心就两个字:随身。
新功能叫 Pocket,Beta 版。装完之后,你在飞书、微信、企业微信、Slack 里都能直接使唤它。地铁上、会议间隙、出差路上,手机发句话,你工位上的电脑就开始干活,完事把结果扔回对话里。有点像雇了个 7×24 的实习生,只不过不用给他买咖啡。
另一个更新是 Computer Use。简单说,这 Agent 现在能"看"屏幕、动鼠标、敲键盘,像真人一样操作你电脑上的软件。本地的设计工具、内部报表系统、藏在设置深处的开关、需要多个应用接力才能搞定的流程——以前 Agent 够不着的地方,现在它都能碰。
官方举了几个场景:
找文件。Agent 在你桌面上定位文件,直接回传到对话。人还在外面,文件已经到手。
筛简历。Computer Use 读取本地 Resume 文件夹,理解内容,飞书 CLI 把分析和面试题写进文档,链接扔回来,点开就看。
改系统设置。Agent 打开设置面板、调整下拉菜单、启动客户端、截图回传,全程在 IM 里可见。
这事的微妙之处在于:它没试图做一个新入口,而是寄生在你已经在用的通讯工具里。微信和飞书成了遥控器,你的电脑成了执行终端。对普通用户来说,学习成本几乎为零;对企业来说,现成的 IM 权限体系可以直接复用。
当然,Beta 版的"Beta"两个字建议读重音。让 AI 在本地电脑上自由操作,权限边界怎么划、误操作怎么防、隐私怎么保,都是待填的坑。但方向是明确的:Agent 正在从"能聊天"往"能办事"走,而且越走越深。
MiniMax 同时开源了 M2.7 模型,主打自主训练和复杂任务能力。模型和 Agent 双线推进,这家的节奏感很有意思。
一个值得注意的细节:Pocket 支持接入的 IM 列表里,微信和企业微信是分开写的。这意味着它可能绕过了某些官方接口限制,走的多半是本地桥接方案。技术实现上有取舍,但用户体验上确实更顺滑——毕竟,让中国人为了用 AI 再装一个通讯软件,难度堪比让北方人接受甜豆腐脑。
热门跟贴