• • 当 AI 一天产出上万行代码,没有人能一行行看,你要学会的:是当老板

  • • 在编程的时候,模型已经不主动写注释了

  • 你不知道未来的竞争对手是什么,OpenClaw 从来没说自己是编程工具

以上内容来自我和 WorkBuddy 负责人李超的一次对话
我们可能完全都错了

本篇归属「赛博史记 · 逮虾户列传
记录这波浪潮里最前沿的一批人在想什么、在做什么

腾讯在深圳总部广场搞了一场线下活动帮大家免费装龙虾,来了上千人,Peter(OpenClaw 创始人)在 X 上转了。与此同时,腾讯云、企业微信和 Claude 也都开始了龙虾的相关服务

WorkBuddy 产品界面
打开网易新闻 查看精彩图片
WorkBuddy 产品界面

昨天,也就是 3 月 9 日的时候,腾讯发布了 WorkBuddy,被叫做「腾讯版龙虾」。完全兼容 OpenClaw 的 skill,但不需要自己买服务器部署,不需要自己买 token,安装即用,1 分钟连上企微

对话 WorkBuddy 李超:快,是唯一正确的事
打开网易新闻 查看更多视频
对话 WorkBuddy 李超:快,是唯一正确的事
WorkBuddy 1 分钟连接企业微信

李超是 WorkBuddy 的负责人。WorkBuddy 从腾讯云的 AI 编程工具 CodeBuddy 长出来,腾讯内部超 90% 工程师在用 CodeBuddy,AI 生成代码占比超 50%

趁着 WorkBuddy 上线,我去找他他聊了一个多小时,聊产品路径,聊人和 agent 的关系演变,聊信任机制,聊一些他自己也说「不知道答案」的问题

上周才开始做的

我问李超,Work Buddy 这个东西是不是年前立项的,过年大家加班搞的?

他说不是,年前主要在做 WorkBuddy IDE 的升级。Claw 模式是年后返工才做的。团队内部的人在旁边补了一句:「这个确实都不能说是年后,应该就是上周才开始」

一个 AI 团队用 AI 做 AI 工具,从动手到发布,一周

李超自己的解释很直接:因为是 AI 团队,你自己本身对 AI 的使用要求就很高,所以出产品就是要这么快

这个速度放在以前完全不可想象。但现在的语境下,GPT-5.4 前天发布,用户三个小时就开始骂「怎么还没接上」。以前一个技术上了两天就接上,大家觉得真快。现在新模型发了三小时没接上,评论区已经炸了

忍耐度在指数级下降。对应的,出手速度必须指数级上升

李超说了一句我记下来了:
你得代表最先进生产力,别人才相信用你的工具也有最好的生产力

CodeBuddy 比 Cursor 更早 Skill,其 Claw 模式在国内 coding 类产品里目前没有看到第二家发布的。GPT-5.4 出来第二天就接上了

快,就是这个时代最对的事情

编码往下沉了

在过去,编程是程序员的专属,即便是 AI 编程也是。

CodeBuddy 最早便是帮开发者写代码提效的
所提供的补全、Chat、Craft 模式,都是围绕着编程这个实际场景

但,李超并不想和我聊这些

他说了一个发现:当 coding agent 被驯化得足够强之后,它能干的远超 coding 本身
它能操作你的日常办公文档,能帮你做数据报表,能帮你处理各种知识工作。编码能力变成了一个底层工具,用户甚至不需要知道它的存在

程序员来说,写代码是目的
对 WorkBuddy 的用户来说,编码只是手段。手段会往下沉

他举了一个自己的例子。最近要出 DAU 数据报表,只给 agent 一条最基础的 SQL,让它自己衍生。agent 自己知道要算用户重叠度、按时间和人群拆维度,最后产出了一整套用户增长逻辑的报表。以前这个事要好几个人花好几天

还有一件小事:他现在给自己写小工具的时候,甚至愿意让 agent 写测试用例。单测、端到端测试,全写。以前正式代码的测试都要花很大劲才愿意做,更何况小工具。但现在,也就一句话的事情

这个变化,有个底层逻辑:以前人做不做一件事,会考虑脑细胞的消耗量
对 AI 来讲,可做可不做的事,就做吧,反正又耗不了多少电

腾讯内部已经有超过 2000 名 HR、行政、运营等非技术岗位在用 WorkBuddy 做数据分析和自动化办公。这些人不关心代码写得怎么样,只关心结果交付

李超说了一个推论,关于框架的:未来很多框架不会有太大发展,因为模型花算力理解新框架,不一定是高效的。前后端一体化,减少上下文摩擦,让 agent 在更短的信息里知道更多东西,这才是方向

从协作到委托

人和 AI 的关系,正在经历三次递减,每一种背后是完全不同的人机关系

第一种:IDE 里的深度协作
人看代码,人改代码,agent 也改代码,人做补全。三者在同一个界面里共同操作。这是目前大多数程序员的状态。李超笑着管这叫「传统程序员」。美国已经有大学在开「现代编程」课,教的就是怎么用 AI 编程

第二种:评论式交互
人不再亲自改代码了,而是选中一段代码,写个评论给 agent,让它改。就像 leader 审员工的代码,你不会说「我们一起编程吧」,你会在代码上批注

第三种:IM 委托
人在手机上给 agent 发一条消息,agent 自己接活、干活、交付

从一到二到三,人在循环中的介入一直在递减。到第三种的时候,人甚至不在电脑前

但李超加了一个关键的前提
只有你能把任务完全委托给 agent 的时候,你才会用 IM 去发消息

你不会用手机指挥 agent 做一件需要不停调细节的复杂工作。那你就开电脑好了。你会委托的,是那些你确信它能做好的事。比如每天整理周报。比如每天早上整理一下今天要干什么

「我会期待它立刻给我返回吗?不会。因为我知道它每天一定会返回。到办公室十点钟坐下来看到结果就好了,或者在地铁上九点钟看到它发给我就好了。我有这个心理预期」

他又说了一个自己的场景。以前经常想下班前发一个很长的 prompt 给 agent 执行,不然觉得这个班白下了。但经常被卡住,agent 有时候要他确认一个 plan,他得等它 plan 完再走

而现在,有了 Claw 模式,确认需求在手机上就能做。你走你的,它干它的
IM 延长了办公周期。你不需要在电脑前,agent 也不需要你在电脑前

对话 WorkBuddy 李超:快,是唯一正确的事
打开网易新闻 查看更多视频
对话 WorkBuddy 李超:快,是唯一正确的事
使用WorkBuddy自动编发运营文案 信任先触顶,然后是管理

信任是有天花板的,而这个天花板之上的东西,才是真正的瓶颈

我问:一个人同时操控多个 agent,产品上会要有怎样不同的思考

他说:核心变化在信息密度
你不可能打开手机五个龙虾每个跟你说 2000 字。未来 IM 里 agent 给你的消息会极度浓缩,你甚至不知道它用了什么 skill、写了什么代码,全部缩掉

「你只关注两件事:AI 告诉你做完了,做的怎么样。然后看一个制品。一个文档,一个 PPT,一个表格。你是开公司的,你员工给你汇报,你不会希望他把所有过程汇报给你的」

那么这里面,那信任的天花板,在哪里?

第一层是信任本身。通过模型能力提升,通过 rule 和 skill 的引导,通过社区的传导(比如你看到别人说「这个工程全都是 AI 写的」),信任会快速建立。这一层会先触顶

触顶之后,瓶颈变成人的认知怎么管理多个 agent?怎么配套工具?怎么编排工作?

对此,李超反复用管理来举例,他说这和人管人是一样的,因为 agent 会越来越像一个人

我想到了雨森的一个观点:用 AI 和当老板是一样的,要把一个抽象的事情变成一个尽可能能执行的活,然后校验最后的结果

李超接了一句:如果这步你做不好,你也管不了那么多 agent。它反而会变成信息轰炸

当然,我自己现在的做法很粗暴,只给 agent 划两个边界
一、硬性的接口和权限,你干的活就在这个地方,别瞎搞
二,大的约定,要提前约好

而对于具体细节?已经超出我的人力范围了
当 AI 一天产出上千上万行代码,没有人能一行行看

模型已经不写注释了

聊到后面,李超说了一个让我停下来想了很久的事情

早期的模型,比如 GPT-3.5,特别喜欢写注释
恨不得每一行代码下面都来一句话。甚至注释里还会夹一些特殊字符,你还得自己删,不小心漏一个出去,别人觉得你不专业

现在的模型不太写注释了。甚至不太主动写文档

他问我:「你发现了吗?」

我说:你不提我还真没意识到,回想一下确实如此,好久没看到模型主动写注释了
人不看代码了,所以不需要注释了。模型感知到了这个变化,自己调整了输出

这件事可能比听起来更值得注意。模型的行为不全是人工调出来的,它在进化&训练过程中也在根据用户的反馈模式做调整。你不看的东西,它就不给你了

人和模型在互相观察。互相改变对方的行为。而这个过程,是悄悄发生的

李超说他不确定是不是完全这个逻辑,但趋势确实在
「这个东西我们也会持续观测,以后有什么有意思的也会分享」

你不知道你的竞争对手是什么

这句话李超说的,让我想了很久

这一波龙虾热里,各家的路径不太一样

模型厂(Kimi、MiniMax、智谱)从 chatbot 往 agent 方向延伸,顺带带模型的量

  • • Kimi 接得最快,因为 K2.5 口碑好加上原来 OK Computer 的底子直接升级

  • • MiniMax 被 OpenClaw 作者官方推荐为「省钱效果好的模型」,使用量暴涨

  • • 智谱甚至专门为龙虾训练了一个新的模型:Pony-Alpha-2

腾讯从 code agent 这条路走,有它的道理
纯云端场景,强模型,你可以做个网站,玩一下。然后呢?怎么跟你的个人工作联合起来?
普通用户面向一个空的新电脑,很难知道自己要做什么

但如果你本地就有文档、有数据、有代码仓库,agent 用编码作为工具把这些东西转起来,再用 IM 跟你随时随地连接,想象力自然就来了。你的资产加上算力,才是真正的生产力场景

「文本是最能凝练信息的方式,最直接,最通用。所以 work agent 一定从 code agent 演化出来,而不是从 chatbot,也不是从 workflow 引擎」

然后我们聊到一个更深入的问题:

我说:OpenClaw 从来没说自己是编程工具,但我感觉它取代了很多编程工具的生态位,

李超不觉得它是编程工具,「真正拿它编程的人,本来也可以用别的方式远程编程」。它更多是给大家打了个样,怎么把 AI 和 IM 更好地连接起来

他之前也尝试过做类似的东西,比如AI 和人共享论坛。当然,这种思路很多人都想到过。但需要三个条件同时到位

  • • 模型成本降低

  • • 大家对 agent 有认知

  • • IM 的端口的开放

三件事同时到位,这事才成了。它只能在这个时间点成

去年 1 月份行吗?不行。去年 2 月份呢?也不行
second me 去年就有了,技术实现上差不多,但当时没火。就像电车早于汽车出现,但电池不够大的时候,什么都做不了

我问:三到五年后,WorkBuddy 做成了,你觉得跟今天做对了什么有关系
他说:不停跟进最先进的东西,然后最快给到用户

「去年能看到今年是这个样子吗?我根本看不到三年之后会是什么样子」

他把 WorkBuddy 未来的方向定义为「想法变现实的工具」。code agent 是把想法变成代码,未来这个层次会不停提升,从代码到网页到应用

「未来什么代码不是全都由 AI 写的呢」

如果算力足够、模型足够强、computer use 成熟,所有软件都可以被 agent 操作。那软件的前端为什么还要由开发者统一提供?用户自己跟 AI 说一下,界面变成你想要的样子就好了

这都有可能。但说实话,现在说这些,谁也不确定

下班,意味着开工

以前下班就意味着关电脑、结束一天的工作
而未来,下班前的最后一件事可能是给 Agent 布置今晚的任务

李超说他有段时间下班前最怕一件事:agent 正在跑一个长任务,中间卡在一个 plan 确认上。走不了。等它 plan 完再走。「说那个等我一起下班」

现在有了手机端,他终于可以心安理得地走了。回家路上看一眼手机,点个确认,agent 继续干

「因为是做 AI 的,我经常想下班前一定要发一个很长的 prompt 让它去执行,不然感觉这个班就白下了」

以前下班关电脑。现在下班给 agent 开工

这大概是这个时代打工人最诚实的写照了

聊到快结束的时候,我们还吐槽了个:是不是之后也很难区分在家、在办公室以及办公之间的界限了?不仅工作意义上无法区分,甚至可以用 Claw 帮着打卡。

他自己说完补了一句:「这个能不能写」
我说:「好」

然后一层一层的想下去:员工让 AI 写周报,老板让 AI 读周报。员工让 agent 干活产出代码,老板让 agent review 代码。群聊里所有人都在热火朝天地讨论

然后大家在楼下咖啡厅碰见了

真是个赛博的世界

WorkBuddy 下载地址 https://www.codebuddy.cn/work/ Web 端 国内版 https://www.codebuddy.cn/agents/ 国际版 https://www.codebuddy.ai/agents 新用户注册送 5000 Credits,无门槛 https://www.codebuddy.cn/profile/usage