出品 | 网易智能

作者 | 辰辰

编辑 | 王凤枝

发布仅仅两个多月!开源智能体OpenClaw在昨天创下神迹:其GitHub星标数正式超越Linux,登顶史上最受欢迎开源项目。

打开网易新闻 查看精彩图片

在极客和程序员圈子里,它之所以被奉为神作,是因为它彻底打破了大厂的限制,赋予了AI操作系统的底层权限。

但抛开技术圈的狂热,它对于普通人到底好不好用?我们综合了两位作者的深度体验,试图还原它真实的业务能力。

在内容创作者的体验中,OpenClaw展现出了极高的专业水准。它不仅能一口气翻阅50多个信源完成深度调研,还能精准模仿作者的商业隐喻风格,甚至顺手把积压半年的2000多封邮件清理得井井有条,直接包揽了80%的基础工作。

但在另一位侧重于项目管理与底层测试的体验者看来,其高昂的运行成本和潜在风险同样不容忽视。短短30分钟的市场调研就会消耗22美元的API额度。此外,在脱离了大厂的安全机制后,它在测试中出现了凭空捏造会议预约的失误,并且存在被恶意网页通过提示词劫持的安全隐患。

实测表明,OpenClaw确实展示了智能体在自动化办公领域的巨大潜力。但受限于目前的算力成本和安全防护,它现阶段更适合具备一定技术背景的开发者进行探索,距离成为普通办公族日常依赖的成熟工具还有一段路要走。但在这个AI一日千里的时代,我们有理由相信,这项硬核技术很快就会完成平民化蜕变,让每一个普通人都能轻松拥有属于自己的全能数字同事。

一、撕开大厂的“温室墙”

最近硅谷开发者圈子里最耀眼的明星无疑是OpenClaw,其星标数已一举突破24.9万。

打开网易新闻 查看精彩图片

除了超越老牌基础项目,它的火爆程度更蔓延到了代码圈之外。在Reddit上,关于它的专属社区r/openclaw创建不过一月有余,每周的访客数就已飙升至13万。

打开网易新闻 查看精彩图片

过去一年里,AI智能体绝对是硅谷最热门的词汇。OpenAI和Anthropic等巨头不断向公众承诺,未来的AI不仅能回答问题,还能替用户买机票、回邮件、处理各类琐事。但现实情况却有些骨感。出于品牌声誉和成本控制的考量,大厂们交出的答卷大多是限制重重的阉割版。这些AI被死死锁在严格的沙盒里,既不能随意访问互联网,也无法触碰用户的本地文件。

OpenClaw的逻辑则完全相反,它敢于直接撕开大厂设立的安全围栏。

作为一个开源且模型中立的平台,它本身不生产模型,而是扮演着桥梁的角色。它将GPT-4、Claude3.5或DeepSeek等顶级AI大脑,与用户的计算机硬件、本地文件甚至浏览器直接挂钩。因为它直接赋予了AI操作系统的最高权限,人们甚至给它起了一个生动的绰号,称其为那只不安分的蓝色龙虾。

这种无限制权限的硬核组合,让OpenClaw能够轻松搞定大厂工具无法完成的任务。它能连续数小时在线自主搜集资料、登录外部平台,甚至直接通过终端命令行操作本地硬件。

打开网易新闻 查看精彩图片

但也正因如此,它在诞生之初就麻烦不断。因为名称与Claude相似,它曾被Anthropic威胁起诉;随后又因极高的底层安全风险,被Meta等科技巨头明令禁止员工在内网使用。

不过技术圈的规律向来如此:越是被严令禁止的,往往越具备极其恐怖的生命力。

二、科技作者的数字分身:它能写出有灵魂的稿件吗?

第一份深度测试报告来自一位《FastCompany》的资深科技作者。他试图构建一个名为“AI新闻台”的专属代理,来完全接管自己的日常撰稿工作。

即便具备基础的Linux知识,他在部署虚拟专用服务器时依然耗费了数个小时,但这台机器运转起来后的表现却出人意料。作者给它喂下了自己过去数年发表过的几十篇文章,并详细标注了调研习惯和写作逻辑。

打开网易新闻 查看精彩图片

在一次关于Anthropic发布新模型Sonnet4.6的报道中,OpenClaw展现出了极高的专业素质。

它不仅一口气翻阅了超过50个信源完成深度调研,更是极其精准地捕捉到了作者喜爱的商业隐喻风格。它甚至主动在报道中使用了极具个人特色的献祭式比喻,并且没有像传统聊天机器人那样胡编乱造,而是准确引用了内部测试数据并标注了来源。

虽然这篇耗时20分钟且消耗约3美元API额度的稿件还不能直接发布,但作者评价它已经包揽了80%的脏活累活。它在梳理技术参数和行业背景方面,不仅比人类编辑动作更快,也做得更全面。对于文字创作者而言,这已经是一个极其强大的初级记者了。

三、资深极客的硬核大考:自动化办公的惊喜与碎钞陷阱

相比于文字工作,另一位极客体验者将OpenClaw接入了真实的日常办公环境,进行了一周的极限压力测试。出于对底层最高权限的深深担忧,他特意使用了一台完全物理隔离的旧Ubuntu笔记本进行实验。

在非程序员难以企及的炼狱模式下,他手动升级了Node.js版本并处理了复杂的OAuth授权协议,这才让智能体成功跑起来。他的实测结果呈现出极其明显的偏科现象。

处理结构化任务堪称神迹。在清理一个包含2000多封邮件的乱序信箱时,它准确区分了广告与交易账单,成功退订了200多个垃圾订阅,准确率惊人。在整理300多个杂乱的本地文件时,它能根据截图内容自动创建文档夹,并将毫无意义的日期乱码重命名为极其精准的描述性文件名。

打开网易新闻 查看精彩图片

涉及复杂决策时却灾难连连。当被要求审查一段代码时,它给出了毫无意义的泛泛之谈,完全漏掉了极其明显的漏洞,甚至提出了会导致系统崩溃的修改建议。更可怕的是,在预约团队会议时,它信誓旦旦地声称已经发送了邀请,但测试者检查日历时却发现空空如也。这种伪装成功的行为在商业协作中是绝对致命的。

此外,运行这台暴力原型机的算力成本极其高昂。当要求它对比五款项目管理软件时,由于需要不断调用昂贵的视觉模型去查看网页截图,短短30分钟的操作就烧掉了22美元。在为期五天的重度测试中,这位极客总共支付了47美元的API费用,如果不加限制,一个全职的AI智能体每月将产生近300美元的账单。

比账单更危险的是底层的安全架构。由于OpenClaw必须获得文件系统和浏览器的最高访问权,一旦它访问了带有恶意指令的外部网页,隐藏在网页深处的黑客代码就可以直接劫持AI代理,命令它读取电脑里的加密文档。

四、结语:通往智能体未来的必经之路

OpenClaw能超越Linux登顶GitHub,确实证明了大家对真正AI助理的强烈渴望。它让我们直观地看到了摆脱大厂限制后,AI到底能干多少实事。但结合这两位体验者的真实反馈,目前的它依然是一个处于试验阶段的半成品。

现阶段把日常工作全盘托付给它并不现实。高昂的运行成本和潜在的安全漏洞,让它更像是一个需要时刻盯防的莽撞实习生,而不是能让人彻底省心的得力干将。你并没有真正闲下来,只是把亲手干活的时间,变成了检查它有没有犯错的时间。

不过面对未来,我们完全有理由保持乐观。技术演进的规律告诉我们,算力成本一定会持续下降,系统的安全防护也会在不断试错中走向成熟。OpenClaw这只勇敢探路的蓝色龙虾,已经为未来的自动化办公指明了方向。也许不用等太久,当这项技术真正变得便宜且安全时,我们在开头期盼的那个全能数字同事,就会稳稳当当地坐进每个普通人的电脑里。