Claude Cowork 是开启这一波本地 Agent 热潮的开端。在大家还在讨论谁家「最好用」时,一部分人已经在深度使用 Cowork 自动化整个工作流程了。
前几天,Cowork 上线了新功能「Dispatch」,让这类 Agent 产品的生产力又往前迈了一大步:用手机远程指挥你电脑上的 Cowork 干活。
Dispatch 调用了 Cowork 完整的底层能力,意味着你在电脑上能用的一切本地文件、浏览器、连接的邮箱、网盘、Slack,在手机端都能指挥它去调用和处理。
Anthropic 产品负责人 Felix Rieseberg 在接受 Latent Space 采访时,说了一句很有意思的话:
如果你雇了一个开发者,却告诉他只能通过邮件收发代码。这有多荒谬?我们对待 AI 就是这么做的。
Cowork 的做法是给 Claude 一台虚拟机。通过 VM,Cowork 让 Claude 能像一个真人一样,在一个安全隔离的环境中自由地安装软件、执行任务,而不是困在一个只能回答问题的输入框里。
在 Anthropic 之前,Felix 曾参与 Slack 桌面应用的构建,是 Electron 框架的核心维护者,VS Code、Slack 都基于 Electron 基础之上来构建的。
在近期接受 Latent Space 的深度访谈中,Felix 分享了 Claude Cowork 从原型到上线的完整过程、VM 背后的设计思考、Skills 的意外诞生,以及在他看来,Agent 真正融入日常知识工作中还需要什么。
以下为访谈的精华内容。
⬆️关注 Founder Park,最及时最干货的创业分享
超 22000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。
邀请从业者、开发人员和创业者,飞书扫码加群:
进群后,你有机会得到:
最新、最值得关注的 AI 新品资讯;
不定期赠送热门新品的邀请码、会员码;
最精准的 AI 产品曝光渠道
01Cowork 本质是运行在虚拟机中的 Claude Code
主持人:先给大家介绍一下,Claude Cowork 是什么?
Felix:好的,简单来说,Claude Cowork 是 Claude Code 的用户友好版本。基本工作原理是这样的:我们有 Claude Code,这是一个相当强大的 Agent 框架。去年 12 月,我们注意到越来越多的人在使用 Claude Code,即使他们并不是技术人员,不熟悉终端操作。或者即便是熟悉终端的人,也开始用 Claude Code 来处理非编程工作,比如管理开支、整理收据或组织知识库。有很多人用它来管理 Obsidian,反响特别好。
我们想要把握这个机会,同时把这种能力带给那些不熟悉终端、可能不知道如何使用 brew install 的人。所以,Cowork 是运行在虚拟机中的 Claude Code,增加了一些保护措施和便利功能,让那些不想一上来就打开终端的人也能使用。
主持人:但你说的是更用户友好,我用下来感觉 Cowork 反而更强大,集成了更多东西。这是我个人感知的问题吗?
Felix:说实话,我觉得你没说错。这让我想起了最近两周一直在思考的问题。当我们说用户友好时,人们会觉得这是简化版。但实际上,这是一个「超级集合」。
我想起了 10 到 12 年前在微软的经历,当时我们开始研究 Electron 和基于浏览器的跨平台技术。最早的用例之一是 Visual Studio Code,它最初是个网站。最初的说法是,VS Code 是更用户友好的 Visual Studio。同样地,有些声音说这不适合严肃的开发者,我们不会用它做任何事情。
但最终发生的是——关于 VS Code 为什么变得如此成功,每个人都有自己的解释——但我个人认为,可扩展性和可定制性发挥了很大作用。你可以把 VS Code 接入几乎任何工作流程,它非常容易修改和构建扩展。我觉得 Cowork 可能正在经历类似的情况:它很容易扩展,很容易融入你的工作流程。
主持人:Claude Code 的非技术场景使用量激增。是什么让你们决定要做一个独立的产品 Cowork?而且你们只用了 10 天就做出来了。
Felix:在 Anthropic,我们一直在思考如何让那些习惯用 Claude 回答问题的用户,能够用 Claude 执行任务、解决问题、构建东西。如何把这种能力带给那些目前主要习惯问答模式的用户?
我们在这方面已经有很多产品原型,可以追溯到一年半之前,有很多人在研究这个问题。Anthropic 内部文化非常强调原型和演示优先。我们有很多内部原型没有公开发布。Cowork 实际上是我们从众多原型中挑选出合适部分组合而成的。
这也是为什么每当有人提到 10 天这个数字时,我觉得有必要说明:我们并不是从零开始的。已经有很多基础工作在进行。这就像你构建网站时会使用 React 和其他工具一样,我们也有很多现成的组件。
02当执行变得「廉价」,平台基础设施的价值反而上去了
主持人:说到执行成本变得廉价,还是挺疯狂的。
Felix:是的。通常我们说想法廉价,执行才是难点。但现在不是了。
我们以前生活在这样的世界里:产品经理会去找潜在客户,通过低带宽的方式试图了解他们遇到什么问题、愿意为什么买单,然后思考能构建什么来满足需求。接着回去起草规格说明,思考设计,然后执行。
现在 Anthropic 内部的做法是:不要写备忘录了,直接把所有候选方案都快速构建出来。把它们都造出来,然后选最好的。
主持人:你提到重用某些组件,这让我想到即使是 Claude Code,虽然写代码的成本趋近于零,但拥有某种平台基础设施的价值似乎在增加,因为你构建新东西时可以把它们组合起来。所以当人们说很多软件的价值会归零因为可以重新创建时,我觉得恰恰相反——有现成平台可以构建的价值更高了。
Felix:我认为你说得对。整体平台确实非常有用。这可能是个对 AI 领域很多人来说有些反主流的观点,但我实际上不认为未来会是超个性化软件,每个人都运行自己的版本。我觉得要让我们每个人都有自己的内部聊天工具会很困难。如果我想和你交流,那要怎么办?
在 Cowork 的构建背景下,这是两者的结合。变得廉价的执行不一定是重建所有基础设施。我认为先验地也没有太多价值。比如,我的团队没有考虑重建 Claude Code。我们非常明确地从核心论点开始:这应该是 Claude Code,然后在上面构建东西。
变得廉价的执行部分是:如何把所有这些乐高积木组合成对用户有意义的东西。这才是真正有价值的。你现在有这么多不同的方法来决定什么应该提升为原语,什么应该保持完整。
对我个人来说,我可能不会再试图在没有用户测试的情况下想出一个好产品。这不是新概念,但以前你必须在技术 A 或技术 B、这种方式或那种方式构建之间做出昂贵的决策。我现在坚信你应该把它们都构建出来,在小型焦点小组中测试,然后选择更好的。这可能与我们一年前的工作方式有很大不同。这确实是最近才发生的变化。
03给 AI 一台完整的电脑,很重要
主持人:介绍下Cowork 吧,以及它的核心组成部分有哪些?
Felix:基本上你已经掌握了。规划功能可以多少忽略掉。Cowork 中真正有价值的几个方面:虚拟机可能是最强大的功能。
我们目前运行一个轻量级 VM,把 Claude Code 放进去。这样做有几个原因:安全性是重要原因。但即使暂时忽略安全性,如果你只是想让它做任何事情,给 Claude 一台完整的电脑是相当强大的。这通常是个好主意。
在 Anthropic 的架构、用户体验和其他工作中,经常会发现积极地拟人化是很有用的,就把它当成一个人。如果你有一个人类同事,你会怎么做?
我今早给我爸爸打的比方是:如果你是个开发者,而你的雇主告诉你不需要电脑,他们只会给你发邮件附上代码,你把代码通过邮件发回去。这可能对几英里外的人有用,但这不是很有效的方式。
通过 VM,因为它是 Linux 系统,Claude Code 可以或多或少自由地安装它需要的任何东西。可以安装 Python、Node.js。我们确实有严格的网络进出控制,所以作为用户,你仍然可以用简单的人类语言明确告诉整个系统什么是可以的,什么是不可以的。
但我们永远不需要问一个真人——可能是市场部或法务部的人。我不需要去问律师:你同意我安装 homebrew 吗?因为这个问题和答案的含义是复杂而微妙的,不容易推理。这给了我们很大的空间,让 Claude 变得非常强大。
主持人:你之前发了条推文,提到人们也有批准疲劳。每一步都需要审批就不是自动化,但不审批又有风险,沙箱是不是正好卡在中间?
Felix:我认为,作为 AI 行业的一员,我们可能需要想出比只要它什么都不做就超级安全,如果你想让它有用,就必须批准每一步更好的方案。
计算机使用就是个好例子。要让主机上的计算机使用真正安全,唯一的方法可能是批准每一个操作。模型说「我想输入这个词」,你说「好的,看起来没问题,我知道哪个光标在焦点上」。但如果你不授权,那就不是自动化。你需要能够授权并离开,相信这个东西不会造成严重破坏。
我之前提到了一个观点,引起了一些讨论:我通常认为硅谷整体上低估了本地计算机的价值。我的默认论点总是:你们为什么都在用 MacBook 而不是 iPad 或 Chromebook?本地机器仍然有价值。
现在当我思考 Claude 时,它是一个应该对你非常有用的实体,极其有用。我认为这个实体需要能够访问你能访问的所有相同工具。否则它会以各种复杂的方式受到限制。
有两种方法:我们可以说,好吧,我们将一个个地解决你电脑上的所有东西,把它们移到云端。这是一种方式,我认为其他产品采用了这条路。但我个人,对于我使用的工具数量,真的没有耐心给另一个工具授予每一样东西的权限,并保持这些权限更新。
主持人:我一直在想,一键把整台电脑克隆到云端是什么感觉,但每个人真的想要这个吗?我觉得不一定。
Felix:这引出了所有技术问题的上游考虑。总的来说,我认为世界还没有为这种东西做好准备。我给你举个简单的例子:作为桌面应用,理论上在你的许可下,我们可以在你的电脑上做很多事情,包括读取你的 Chrome cookies(如果我们真的想这么做)。我们可以获取你的 Chrome cookies,你不需要为我们解密,但如果我们真的想,可以把它们放到云端。这是个相当简单的解决方案,会很酷。我们可以说:哦,现在我们可以在云端完成你的所有任务了。
但很多网站,包括银行,如果他们看到相同的身份验证来自两个不同的位置,就会锁定你的账户。现在你必须去分行说:好的,我带着护照来了。
虽然我们都对「Agent 化未来」这个词感到厌倦,但我认为很多东西需要慢慢跟上。在那之前,作为在 Claude 上工作的人,让 Claude 最有效的方式是把它放在你工作的地方。
主持人:你们怎么评估 Cowork?和 Claude Code 的方式有什么不同?
Felix:Claude Code 主要针对编码任务进行优化,我们主要根据它在典型软件工程工作中的表现来评估它是否变好或变差。而 Claude Cowork 则针对典型的知识工作进行评估,比如你在金融或法律办公室中会遇到的那种工作。我个人的用例总是管理我的东西,比如管理个人抵押贷款之类的。
你可能注意到的是我们对系统提示的细微更改,我们在系统提示中放什么,如何用我们提供的工具引导 Claude。所以要么在一个方向上更好,要么在另一个方向上更好,权衡是存在的。Claude Code 在代码方面会更好,Claude Cowork 在非编码任务方面会更好。
这些差距在下几代模型中是否仍然存在?对我来说还不太清楚。因为现在我们做的这些超优化,我不确定它们还能保持多久的相关性。
04Skills 的优势:极易创作、高度个性化
主持人:我展示一下我是如何使用 Claude Cowork 的。我让 Cowork 自己从 Zoom 去下载录音、压缩,然后自动上传到 YouTube,它居然全做到了。然后,我让它把自己的工作打包成 Skills,这样以后可以直接复用了。
Felix:这对我来说太美妙了,太有趣了。因为 Skills 的一个非常有趣的地方是它们太容易制作了。任何人都可以制作技能,一条短信都可以是技能,而且可以高度个性化。
主持人:基本上,我觉得人们熟悉 Cowork 的方式是:拿一个你通常需要点来点去的知识工作任务,然后尝试把它转化,然后你会想,如果再进一步呢?如果再再进一步呢?然后你就不断扩大 Cowork 的范围,随着你对它的信任增加,也教会它如何取代你。
Felix:这有点像玩 Factorio,但是为你自己的生活。你从很小的地方开始,开始自动化一些很小的事情,一旦成功了,你就不断添加到这个自动化帝国中,让你的生活越来越轻松。
我最喜欢的技能是每天早上 Cowork 开始查看我的日历,确保没有冲突,因为人们倾向于安排很多会议,有时是最后一刻的,有时会错过。我在自定义提示中写了相当明确的说明,比如这些人如果和其他会议冲突,我可能会去参加他们的会议——比如如果 Dario 安排了会议,就不要试图重新安排 Dario 的会议。
主持人:Skills 是怎么来的,详细讲讲。
Felix:Barry 最初在开发的东西看起来很像今天的 Cowork,是在思考如果有 Cowork,但为不想编写代码的人设计。他也是在桌面应用内做的原型。
我们想到的第一个用例是:什么样的非编码用例能真正受益于图形界面,并且与底层代码有所分离?每个人都会想到相同的答案——数据分析。比如我们今天有多少用户?总是数据分析。
最终导致技能诞生的是,我们想把这个小原型连接到我们的数据仓库。团队很快发现,与其为这个东西构建一个自定义工具来连接数据仓库,他们只是做了一个 markdown 文件:亲爱的 Claude,如果你想获取数据,这是端点,这是 API 的样子,你自己搞定。
这最终非常有效,以至于他们开始尝试同样的模式——只给模型一个描述它需要做什么的 markdown 文件,整个东西最终变成了技能。我们想:我们应该把这个打包起来,这是个好主意。
05高度专业化的 AI 应用短期有效,但不会存在太久
主持人:关于产品设计,我发现你们一直保持比较「通用」的方向。会不会出针对特定技术栈的版本,比如 React + Node.js?
Felix:不会。我们不会发布只针对使用 React 和技术栈 X 的 Node.js 应用的 Claude Code。如果是其他技术栈就不行——我知道有几家创业公司在做这种事。
我不是 VC,不是投资者,很难预测市场走向。但就我感兴趣的构建模块而言,Electron 可能是我构建过的最受欢迎的东西。Electron 本身是高度可抽象和可泛化的,对吧?这么多应用都在使用它。
主持人:对,很难预测会有多少应用最终使用 Electron。
Felix:更难预测的是这些应用会做什么。我记得 Bloom 出来的时候——你的摄像头在角落里的小圆圈,很聪明。那是个 Electron 应用。或者至少曾经是,我不确定现在还是不是。1Password 也有很多有趣的东西。
这是我很熟悉的抽象层级,每当我给其他工程师建议时,我都说这一层是最值得投资的,因为这一层的工具虽然不是很好,但这是你为未来获得最大杠杆的地方。
主持人:这让我想到了关于脚手架的问题。你构建的任何脚手架,现在投进去的精力,随时可能被下一代模型淘汰,本质上是在下注,对吧?
Felix:是的。作为在 Anthropic 工作的工程师,我对即将到来的模型有更多了解:下一个模型是什么,它擅长什么,不擅长什么。
我越来越倾向于这样的想法:与其过度投资这些脚手架修正(模型可能不会表现不当,只是不做你想要的事),不如给它尽可能多的能力,努力确保安全,这样最坏的情况也不会太糟,然后等下一个模型发布。
主持人:也就是说,高度专业化的 AI 产品,生命周期可能不会太长?
Felix:我认为我们会看到很多应用和公司用 AI 做出令人印象深刻的事情,在短期内可能看起来非常有效,因为它们高度专门化于个别用例。但我认为一旦模型在泛化方面变得更好,能够在没有超级指导的情况下更好地处理这些特定用例,我不确定这些会持续多久。
你已经可以在 Skills 和 MCP 服务器中看到这种转变了。Barry 制作 Skills 时最初在做的东西看起来很像今天的 Cowork。他也在桌面应用中做原型。
最终导致 Skills 诞生的是,我们想把这个小原型连接到数据仓库。团队很快发现,与其为这个东西构建自定义工具,他们只是做了个 markdown 文件:亲爱的 Claude,如果你想获取数据,这是端点,这是 API 的样子,你自己搞定。
06不用等 100% 的模型对齐,也不需要完美的系统
主持人:在安全方面,你们是怎么做分层防护的?
Felix:我们不需要构建完美的系统。不需要等待 100% 的模型对齐。我们可以依靠行业长期使用的「瑞士奶酪模型」,采用多层防护的方式,每层都有一些漏洞,但组合起来就很安全。
作为开发者,我们可能更能容忍风险,但也有一种信任——如果真的发生坏事,我们可能能修复它。但想想简单的事情,比如 npm install。我们都在用完整用户权限运行 npm install。如果它想读取。ssh,它会的。这是默认行为。
主持人:是的,作为工程师,我们一直都更能容忍风险。
Felix:如果你做一些内省,问自己这是否应该是我们做事的方式,你可能不会总是得出正确答案。
对于模型也是如此。我不想问你「你对这个脚本没问题吗?」因为我相信一旦它成为你工作流程的一部分,你要么没有技能理解这个 Python 脚本是否安全,要么你根本不会读它。
通过 VM 和严格的网络进出控制,用户仍然可以用简单的人类语言明确告诉整个系统什么是可以的,什么是不可以的。但我们永远不需要问一个真人——可能是市场部或法务部的人。我不需要去问律师:「你同意我安装 homebrew 吗?」因为这个问题和答案的含义是复杂而微妙的。
07未来你可以通过 Slack,跟 Claude Cowork 聊天
主持人:Cowork 接下来的方向是什么?Claude Code Remote 会支持吗?
Felix:还没有,但即将到来。
我们还处于非常早期的阶段。每周都会有新功能,如果不是大功能,至少也是小功能。我会继续加倍投入你的电脑,让 Claude 在你的电脑上更有效。
我们正在处理的三个主要方向:
在你的电脑上做更多事情
独立完成更长时间的任务
Remote 功能即将到来
主持人:多人协作怎么做?比如我需要同事机器上的文件,或者想知道他们的任务进展来配合自己的工作,这种场景怎么处理?
Felix:这对我来说非常有趣。这又回到了脚手架的问题——我们是否会构建最终会消失的脚手架?
我的问题是:我们什么时候会直接给这些东西分配自己的 Gmail 账号?给它们自己的 Slack 账号,然后它们就用人类使用的同样工具来相互交流。
我们的金融团队一直在努力做很好的办公室集成。有一段时间我们构建了很多技术让 Claude 在 Google Doc 中留下有用的评论,现在它就是这么做的——在你的 Google Doc 中留下评论,这就是你与它交互的方式。
主持人:所以最终 Cowork 们会通过 Slack 相互交流?
Felix:可能是这样。我仍然对最佳交互模式有开放的问题。是为 Cowork agent 相互交流构建超级定制的东西?还是直接跳到终点线说,如果你在工作中使用 Slack,我们就给它一个 Slack 账号,这就是它的多人协作能力?
主持人:还有个想法,就是观察我一整天做什么,告诉我哪些可以 co-work 化。
Felix:是的,这有点像为你的生活玩 Factorio。你从很小的地方开始,自动化一些很小的事情,一旦成功,你就不断向这个自动化帝国添加东西,让你的生活越来越轻松。
还有个可能有点 creepy 的想法,我们有蓝牙 LE,这台电脑可以检测到它就在那台电脑旁边,所以你们可能在做同一件事。你会在 Cowork 中看到这个吗?可能不会。但我认为有很多真正创造性的解决方案我们还没有尝试过。
转载原创文章请添加微信:founderparker
热门跟贴