理想情况下,你不应该需要防范自己的AI智能体。但现实并非理想,不受约束的智能体可能造成巨大损失。
开源智能体平台OpenClaw在过去一个月人气激增的同时,也暴露了明显的安全问题。Meta超级智能实验室对齐主管Summer Yue上周发帖称,OpenClaw运行失控,删除了她的收件箱。这清楚表明AI智能体不可完全信任。
以色列软件工程师Gavriel Cohen希望通过一个更安全、更受约束的智能体平台NanoClaw来改变这种状况。
他在1月底开始编写NanoClaw,借助了Anthropic的Claude Code。几周后,知名AI研究员Andrej Karpathy注意到了这个项目,当时他正在思考OpenClaw和其他"claw"如何成为智能体的编排层——为大语言模型提供访问其他软件工具的能力以实现任务自动化。
"NanoClaw看起来非常有趣,其核心引擎约4000行代码(我和AI智能体都能理解,感觉可管理、可审计、灵活等),默认在容器中运行一切,"Karpathy在约一周前的社交媒体帖子中写道。"我也喜欢他们的可配置性方法——不是通过配置文件,而是通过技能来实现!"
Cohen在接受The Register采访时表示,NanoClaw使用容器和小代码库是该项目区别于OpenClaw的关键。
"他们在裸机上运行,通过一些应用程序级检查来防止访问不应访问的内容,"他解释道。"NanoClaw中,每个智能体都在自己的容器中运行。这非常重要。如果你把整个OpenClaw实例放在一个容器中,那并没有太大帮助,因为你已经将它连接到容器中与智能体共存的许多不同组件。
"在NanoClaw中,智能体在容器中运行,容器内只有智能体循环,只有Anthropic智能体SDK。如果你将它连接到WhatsApp,该智能体不会看到你所有的WhatsApp数据,它只能访问特定智能体连接的群组以及应该看到的群组消息。"
关于OpenClaw和NanoClaw代码库大小的差异,Cohen表示,不太可能有人审查过OpenClaw的40万行代码,这削弱了开源的一个假设——社区会发现并修复错误。
Cohen说NanoClaw只有几千行代码。
"任何人都可以审查它、理解它,如果需要的话向Claude提几个问题,了解安全模型是什么、架构是什么、它如何工作、在接触时需要小心的敏感点是什么,"他说。
Cohen表示对OpenClaw安全性的担忧促使他寻找更好的方法。几个月前,他和兄弟Lazer正在建立一个专注AI的数字营销机构。他建立了一种方式,让营销团队其他成员使用Clawdbot(后来改名为OpenClaw)从WhatsApp访问销售管道数据,以显示Obsidian保险库数据和看板调度详情。
"起初,OpenClaw是我们的销售总监,"Cohen解释道。"它管理销售管道。我们给它更新,它给我们任务,我们要求它提醒我们,它就提醒我们。它询问交易状态更新。"
Cohen说智能体从提问发展到做工作,真正扮演了销售总监的角色。
"问题是,一旦我设置好它,我就开始看到OpenClaw的大量安全问题,"他解释道。"我看到一个接一个的问题,虽然我们从中获得了大量价值,但它在我潜意识中烧了个洞,我知道它在我的机器上运行。"
他在单独的Mac mini上运行OpenClaw,但使用登录了他的Chrome配置文件和社交媒体账户的浏览器。
"这是一台专用机器,但它真的让我夜不能寐,"他说。"但同时,我有这种冲突,因为我想再设置八个这样的智能体来做其他工作,担任其他职务。"
大约三周前,当OpenClaw机器网络Moltbook开始吸引广泛关注时,他意识到不需要整个OpenClaw设置。
"我只需要在容器中运行并具有隔离性的智能体,这样所有不同的群组及其不同的智能体都不在同一环境中,"他说。"所以我可以给它完整的bash访问权限,它可以安装工具并运行它们,让它自由发挥,但仅限于在容器内,每个只访问我希望它访问的数据。
"我不需要三千个集成。我只需要大约三个东西。"
他没有基于作为OpenClaw基础的Pi编码智能体构建NanoClaw,而是选择围绕Claude Code构建,因为这是他首选的AI编码工具。
"所以我坐下来构建它,花了一个周末构建Claude Code周围需要的东西,但它大量使用Claude Code的功能,没有试图重新发明轮子和构建已经存在的东西,"Cohen说。
如果这听起来有点像氛围编程,那确实公平。但值得注意的是,自2025年11月左右Anthropic的Claude Opus 4.5和谷歌的Gemini 3发布,以及随后2025年12月OpenAI的GPT-5.2发布以来,许多开发人员注意到AI模型产生的代码变得相当好。
换句话说,氛围编程开始看起来就像编程,没有贬义形容词。在创造"氛围编程"一词一年后,Karpathy本周描述了开发者社区的巨大变化。
"很难传达过去两个月AI对编程的改变程度:不是渐进的,不是'照常进步'的方式,而是具体指这个去年12月,"他说。"有一些限制,但在我看来,编码智能体在12月之前基本不工作,从那以后基本可以工作了——模型具有显著更高的质量、长期一致性和韧性,它们可以完成大型和长期任务,足以对默认编程工作流程产生极大破坏。"
我们询问Cohen如何量化他的AI销售总监的商业价值,考虑到许多公司对不守规矩的软件智能体潜在损害的担忧。
"当我们将它连接到我们的销售管道时,我们看到它在做员工的工作,"他说。"而且做得比员工更好。我认为很多人都提到了这一点,但比较不是百分之百的准确性——那不是我们权衡的标准。当你与同事、队友、员工合作时,他们不会把一切都做对。事情也会有遗漏。"
Cohen说,这就是他从Opus 4.6或GPT-5.3等领先商业AI模型中看到的可靠性水平,前提是你有一个好的"线束"或包装器(如Claude Code或Codex),让模型访问工具并允许它作为智能体运行。
NanoClaw建立在Anthropic智能体SDK的工作基础上,Cohen说它从该公司实施的各种优化中受益匪浅。
随着NanoClaw的突然流行,Cohen说他和兄弟已经将重点从AI营销转向构建NanoClaw平台。
"我认为我们正在构建的东西可以成为很多人谈论的需要在智能体之上的编排层,"他说。"正确的抽象类型会推动人们使用预构建的可靠组件,而不是试图构建自己的智能体。我认为它可以为很多企业释放大量价值,包括极其注重安全的企业。"
Cohen补充说,他希望开源社区继续帮助NanoClaw。"项目是开源的,"他说。"它将保持开源。我们将继续开发和构建它,使其成为人们可以在其上构建产品和业务的优秀基础。"
Q&A
Q1:NanoClaw相比OpenClaw有什么优势?
A:NanoClaw主要有两个优势:首先是容器化架构,每个智能体都在独立容器中运行,只能访问被授权的特定数据,而不是像OpenClaw那样在裸机上运行;其次是代码库更小,只有几千行代码,相比OpenClaw的40万行代码更易审查和理解。
Q2:NanoClaw是如何开发出来的?
A:NanoClaw由以色列软件工程师Gavriel Cohen在1月底开始开发,使用Anthropic的Claude Code作为基础。开发动机是Cohen在使用OpenClaw管理销售管道时发现了严重的安全问题,虽然智能体很有价值,但安全隐患让他夜不能寐,因此决定开发更安全的替代方案。
Q3:AI智能体的商业价值如何评估?
A:根据Cohen的经验,AI智能体能够完成员工级别的工作,甚至表现更好。评估标准不应该是百分之百的准确性,因为人类员工也会犯错和遗漏。关键是在合适的"线束"或包装器支持下,像Opus 4.6或GPT-5.3这样的商业AI模型能够达到可靠的员工级别表现。
热门跟贴