Claude现在能直接操控你的电脑了。不是弹个窗口问你要不要执行,而是真的移动鼠标、点击按钮、填表格——Anthropic把这个功能塞进了Claude Code和Claude Cowork,4月3日刚开放给Windows的Pro和Max用户。
这事儿的蹊跷之处在于:Anthropic自己也不确定这东西靠不靠谱。官方说法是"研究预览版",翻译成人话就是"我们先扔出来看看会炸成什么样"。
从浏览器到整个桌面,AI代理的野心膨胀了
OpenAI去年试过类似的路子,ChatGPT的Operator(操作员)功能被限制在浏览器里活动,结果没掀起什么水花。Anthropic选择直接掀桌:既然浏览器不够用,那就接管整个操作系统。
技术路径是这样的——Claude先尝试用现有的集成接口,比如Slack、日历、已经连好的第三方应用。只有当这些路都走不通时,它才会伸手去碰你的桌面。这不是默认选项,是最后一招。
但"最后一招"的想象空间足够吓人。想象一下:你在通勤路上给Claude发句话,它打开你的Mac,翻遍文件夹找到那份合同,填好数字,发邮件给法务,再把你从日历里拽出来开会。Anthropic给这个远程遥控功能起了个名字叫"Dispatch",字面意思是"派遣",听起来像派了个数字分身去你工位打卡。
收购来的技术,3周就上线
这个功能的核心技术来自Vercept AI,一家专注AI操控电脑的创业公司。Anthropic把它收了,然后发生了件反常识的事。
「所有人之前都担心收购会拖慢进度,结果完全相反。」Vercept联合创始人Kiana Ehsani在X上写道。她的团队从加入Anthropic到产品首发,用了不到四周。
Ehsani把速度归因于文化:「每个人都动得很快,每个人都极其聪明、谦逊、互相支持,把事情做成真的很容易。」她甚至直接点明:Anthropic最大的竞争优势就是人。
这话放在硅谷的并购语境里有点刺耳。通常收购后的整合期以季度计算,团队磨合、代码重构、优先级打架——Vercept的4周冲刺像是对行业惯例的嘲讽。但Ehsani的描述也留下一个问号:这种速度是可持续的组织能力,还是收购蜜月期的肾上腺素?
安全焦虑:把钥匙交给AI,门锁在哪?
Anthropic的谨慎是有原因的。让AI控制整个桌面,攻击面(attack surface,指可能被利用的安全漏洞入口)比浏览器大了一个数量级。
现有的问题清单已经够长了:数据隐私怎么保证?Claude点错按钮导致文件丢失怎么办?用户能不能随时夺回控制权?这些都不是技术细节,是产品能不能从"研究预览"毕业为正式功能的生死线。
更微妙的是信任机制。浏览器里的AI搞砸了,刷新页面就行。桌面AI搞砸了,你可能发现整份季度报表被删进了废纸篓,而Claude还在试图"帮你恢复"。
Anthropic目前的解法是把选择权交给用户层级——Pro和Max订阅者才能用,等于用付费门槛做了道初筛。但这道筛子筛的是支付意愿,不是技术成熟度。
AI代理的竞赛,Anthropic选了最难的一条路
行业里的其他玩家也在做代理(agent,指能自主执行任务的AI系统),但大多绕着走。微软的Copilot深度绑定Office生态,Google的Gemini守着搜索和Workspace,OpenAI的Operator困在浏览器 sandbox 里。
Anthropic的路线是反生态的:不挑应用,不挑平台,直接扎根操作系统层。这让它理论上能做的事最多,也意味着要独自承担整个桌面的复杂性和风险。
一个细节值得玩味:Vercept的技术原本是独立的创业方向,现在成了Anthropic"让AI主动在用户数字环境里工作"这一野心的基础设施。收购不是买功能,是买时间——4周整合周期背后,是对竞争对手的紧迫感。
Windows版本4月3日上线,macOS版本更早发布。两个平台的差异化节奏暗示了技术适配的复杂度:Windows的权限模型、窗口管理、后台进程都和macOS不同,Claude要在两种逻辑里学会"做人"。
用户现在能做什么?如果你订阅了Pro或Max,可以在Claude Code或Cowork里启用计算机控制,远程派遣它去处理桌面任务。但官方文档会提醒你:这是预览版,别拿它处理不能丢的数据。
一位早期测试者在Reddit上的反馈被 Anthropic 产品经理转发:「我让它整理下载文件夹,它把2019年的发票和2024年的合同混在一起了,但至少没删东西。」
这种谨慎的乐观,大概是现阶段最诚实的评价。
热门跟贴