打开网易新闻 查看精彩图片

最近OpenClaw火得一塌糊涂,媒体铺天盖地的报道让我产生了怀疑。通常这种阵仗,背后往往是普通东西被包装得太好。

于是我花时间读完了它的开源代码。结论是:2%的常规技术,98%的营销泡沫。

核心功能其实就两件事:通过即时通讯软件和大语言模型聊天,以及让模型调用你电脑上的工具。这两样都不是什么新鲜玩意。

媒体吹嘘的"神奇浏览器操控能力",根本不是OpenClaw的能力,而是微软Playwright库的能力。Playwright本身就是为程序化控制浏览器而生的,内置视觉模型能把屏幕内容转成文字描述。OpenClaw只是在中间传话而已。

典型工作流程是这样的:你说"帮我在亚马逊买个手电筒",OpenClaw把消息扔给大模型,大模型决定用Playwright打开亚马逊,Playwright返回页面描述,大模型再决定搜索什么、点击什么。整个过程中,OpenClaw就像个跑腿的,模型说什么它做什么。

我翻遍源码,没找到其他值得一提的东西。所谓的"记忆系统"就是把对话存成文本文件,用grep搜索。

这是个不错的业余项目,但仅此而已。

然后评论区炸了。

有人说我漏掉了定时任务、多模型支持、统一网关、子代理协调这些功能。有人说Linux也只是GNU工具的"胶水代码",iPhone也只是芯片和触摸屏的"胶水代码",Uber也只是GPS和支付接口的"胶水代码"。

这个类比很有意思,但也恰恰说明了问题所在。

真正让我停下来思考的是几个真实用户的反馈。一位律师说他的代理两天内整理了海量法律模板,还能协调日程、做法律研究。一位数据分析师终于可以边散步边用语音指挥代理生成可视化图表,不用再被钉在显示器前。一位完全不懂技术的朋友正在用它实现做游戏的毕生梦想。

还有人用它学德语,把它当成超级智能的Anki卡片。有人让它每天早上自动生成一个新应用。有人用它管理整个智能家居。

我承认,把现有组件以正确的方式组合在一起,本身就是一种创造。苹果没有发明图形界面,但把它带给了普通人。

不过我依然认为,理解一个东西的技术本质和承认它的实用价值是两回事。OpenClaw的价值在于降低了门槛,让非技术用户也能调动这些能力。但这不改变它在技术层面确实没有原创性的事实。

集成工作很重要,但我们也不必把集成工作神话成技术突破。

x.com/burkov/status/2020412188683301095