• 当 AI 一天产出上万行代码,没有人能一行行看,你要学会的:是当老板
• 在编程的时候,模型已经不主动写注释了
•你不知道未来的竞争对手是什么,OpenClaw 从来没说自己是编程工具
以上内容来自我和 WorkBuddy 负责人李超的一次对话
我们可能完全都错了
本篇归属「赛博史记 · 逮虾户列传」
记录这波浪潮里最前沿的一批人在想什么、在做什么
腾讯在深圳总部广场搞了一场线下活动帮大家免费装龙虾,来了上千人,Peter(OpenClaw 创始人)在 X 上转了。与此同时,腾讯云、企业微信和 Claude 也都开始了龙虾的相关服务
昨天,也就是 3 月 9 日的时候,腾讯发布了 WorkBuddy,被叫做「腾讯版龙虾」。完全兼容 OpenClaw 的 skill,但不需要自己买服务器部署,不需要自己买 token,安装即用,1 分钟连上企微
李超是 WorkBuddy 的负责人。WorkBuddy 从腾讯云的 AI 编程工具 CodeBuddy 长出来,腾讯内部超 90% 工程师在用 CodeBuddy,AI 生成代码占比超 50%
趁着 WorkBuddy 上线,我去找他他聊了一个多小时,聊产品路径,聊人和 agent 的关系演变,聊信任机制,聊一些他自己也说「不知道答案」的问题
上周才开始做的
我问李超,Work Buddy 这个东西是不是年前立项的,过年大家加班搞的?
他说不是,年前主要在做 WorkBuddy IDE 的升级。Claw 模式是年后返工才做的。团队内部的人在旁边补了一句:「这个确实都不能说是年后,应该就是上周才开始」
一个 AI 团队用 AI 做 AI 工具,从动手到发布,一周
李超自己的解释很直接:因为是 AI 团队,你自己本身对 AI 的使用要求就很高,所以出产品就是要这么快
这个速度放在以前完全不可想象。但现在的语境下,GPT-5.4 前天发布,用户三个小时就开始骂「怎么还没接上」。以前一个技术上了两天就接上,大家觉得真快。现在新模型发了三小时没接上,评论区已经炸了
忍耐度在指数级下降。对应的,出手速度必须指数级上升
李超说了一句我记下来了:
你得代表最先进生产力,别人才相信用你的工具也有最好的生产力
CodeBuddy 比 Cursor 更早 Skill,其 Claw 模式在国内 coding 类产品里目前没有看到第二家发布的。GPT-5.4 出来第二天就接上了
快,就是这个时代最对的事情
编码往下沉了
在过去,编程是程序员的专属,即便是 AI 编程也是。
CodeBuddy 最早便是帮开发者写代码提效的
所提供的补全、Chat、Craft 模式,都是围绕着编程这个实际场景
但,李超并不想和我聊这些
他说了一个发现:当 coding agent 被驯化得足够强之后,它能干的远超 coding 本身
它能操作你的日常办公文档,能帮你做数据报表,能帮你处理各种知识工作。编码能力变成了一个底层工具,用户甚至不需要知道它的存在
对程序员来说,写代码是目的
对 WorkBuddy 的用户来说,编码只是手段。手段会往下沉
他举了一个自己的例子。最近要出 DAU 数据报表,只给 agent 一条最基础的 SQL,让它自己衍生。agent 自己知道要算用户重叠度、按时间和人群拆维度,最后产出了一整套用户增长逻辑的报表。以前这个事要好几个人花好几天
还有一件小事:他现在给自己写小工具的时候,甚至愿意让 agent 写测试用例。单测、端到端测试,全写。以前正式代码的测试都要花很大劲才愿意做,更何况小工具。但现在,也就一句话的事情
这个变化,有个底层逻辑:以前人做不做一件事,会考虑脑细胞的消耗量
对 AI 来讲,可做可不做的事,就做吧,反正又耗不了多少电
腾讯内部已经有超过 2000 名 HR、行政、运营等非技术岗位在用 WorkBuddy 做数据分析和自动化办公。这些人不关心代码写得怎么样,只关心结果交付
李超说了一个推论,关于框架的:未来很多框架不会有太大发展,因为模型花算力理解新框架,不一定是高效的。前后端一体化,减少上下文摩擦,让 agent 在更短的信息里知道更多东西,这才是方向
从协作到委托
人和 AI 的关系,正在经历三次递减,每一种背后是完全不同的人机关系
第一种:IDE 里的深度协作
人看代码,人改代码,agent 也改代码,人做补全。三者在同一个界面里共同操作。这是目前大多数程序员的状态。李超笑着管这叫「传统程序员」。美国已经有大学在开「现代编程」课,教的就是怎么用 AI 编程
第二种:评论式交互
人不再亲自改代码了,而是选中一段代码,写个评论给 agent,让它改。就像 leader 审员工的代码,你不会说「我们一起编程吧」,你会在代码上批注
第三种:IM 委托
人在手机上给 agent 发一条消息,agent 自己接活、干活、交付
从一到二到三,人在循环中的介入一直在递减。到第三种的时候,人甚至不在电脑前
但李超加了一个关键的前提
只有你能把任务完全委托给 agent 的时候,你才会用 IM 去发消息
你不会用手机指挥 agent 做一件需要不停调细节的复杂工作。那你就开电脑好了。你会委托的,是那些你确信它能做好的事。比如每天整理周报。比如每天早上整理一下今天要干什么
「我会期待它立刻给我返回吗?不会。因为我知道它每天一定会返回。到办公室十点钟坐下来看到结果就好了,或者在地铁上九点钟看到它发给我就好了。我有这个心理预期」
他又说了一个自己的场景。以前经常想下班前发一个很长的 prompt 给 agent 执行,不然觉得这个班白下了。但经常被卡住,agent 有时候要他确认一个 plan,他得等它 plan 完再走
而现在,有了 Claw 模式,确认需求在手机上就能做。你走你的,它干它的
IM 延长了办公周期。你不需要在电脑前,agent 也不需要你在电脑前
信任是有天花板的,而这个天花板之上的东西,才是真正的瓶颈
我问:一个人同时操控多个 agent,产品上会要有怎样不同的思考
他说:核心变化在信息密度
你不可能打开手机五个龙虾每个跟你说 2000 字。未来 IM 里 agent 给你的消息会极度浓缩,你甚至不知道它用了什么 skill、写了什么代码,全部缩掉
「你只关注两件事:AI 告诉你做完了,做的怎么样。然后看一个制品。一个文档,一个 PPT,一个表格。你是开公司的,你员工给你汇报,你不会希望他把所有过程汇报给你的」
那么这里面,那信任的天花板,在哪里?
第一层是信任本身。通过模型能力提升,通过 rule 和 skill 的引导,通过社区的传导(比如你看到别人说「这个工程全都是 AI 写的」),信任会快速建立。这一层会先触顶
触顶之后,瓶颈变成人的认知怎么管理多个 agent?怎么配套工具?怎么编排工作?
对此,李超反复用管理来举例,他说这和人管人是一样的,因为 agent 会越来越像一个人
我想到了雨森的一个观点:用 AI 和当老板是一样的,要把一个抽象的事情变成一个尽可能能执行的活,然后校验最后的结果
李超接了一句:如果这步你做不好,你也管不了那么多 agent。它反而会变成信息轰炸
当然,我自己现在的做法很粗暴,只给 agent 划两个边界
一、硬性的接口和权限,你干的活就在这个地方,别瞎搞
二,大的约定,要提前约好
而对于具体细节?已经超出我的人力范围了
当 AI 一天产出上千上万行代码,没有人能一行行看
模型已经不写注释了
聊到后面,李超说了一个让我停下来想了很久的事情
早期的模型,比如 GPT-3.5,特别喜欢写注释
恨不得每一行代码下面都来一句话。甚至注释里还会夹一些特殊字符,你还得自己删,不小心漏一个出去,别人觉得你不专业
现在的模型不太写注释了。甚至不太主动写文档
他问我:「你发现了吗?」
我说:你不提我还真没意识到,回想一下确实如此,好久没看到模型主动写注释了
人不看代码了,所以不需要注释了。模型感知到了这个变化,自己调整了输出
这件事可能比听起来更值得注意。模型的行为不全是人工调出来的,它在进化&训练过程中也在根据用户的反馈模式做调整。你不看的东西,它就不给你了
人和模型在互相观察。互相改变对方的行为。而这个过程,是悄悄发生的
李超说他不确定是不是完全这个逻辑,但趋势确实在
「这个东西我们也会持续观测,以后有什么有意思的也会分享」
你不知道你的竞争对手是什么
这句话李超说的,让我想了很久
这一波龙虾热里,各家的路径不太一样
模型厂(Kimi、MiniMax、智谱)从 chatbot 往 agent 方向延伸,顺带带模型的量
• Kimi 接得最快,因为 K2.5 口碑好加上原来 OK Computer 的底子直接升级
• MiniMax 被 OpenClaw 作者官方推荐为「省钱效果好的模型」,使用量暴涨
• 智谱甚至专门为龙虾训练了一个新的模型:
Pony-Alpha-2
腾讯从 code agent 这条路走,有它的道理
纯云端场景,强模型,你可以做个网站,玩一下。然后呢?怎么跟你的个人工作联合起来?
普通用户面向一个空的新电脑,很难知道自己要做什么
但如果你本地就有文档、有数据、有代码仓库,agent 用编码作为工具把这些东西转起来,再用 IM 跟你随时随地连接,想象力自然就来了。你的资产加上算力,才是真正的生产力场景
「文本是最能凝练信息的方式,最直接,最通用。所以 work agent 一定从 code agent 演化出来,而不是从 chatbot,也不是从 workflow 引擎」
然后我们聊到一个更深入的问题:
我说:OpenClaw 从来没说自己是编程工具,但我感觉它取代了很多编程工具的生态位,
李超不觉得它是编程工具,「真正拿它编程的人,本来也可以用别的方式远程编程」。它更多是给大家打了个样,怎么把 AI 和 IM 更好地连接起来
他之前也尝试过做类似的东西,比如AI 和人共享论坛。当然,这种思路很多人都想到过。但需要三个条件同时到位
• 模型成本降低
• 大家对 agent 有认知
• IM 的端口的开放
三件事同时到位,这事才成了。它只能在这个时间点成
去年 1 月份行吗?不行。去年 2 月份呢?也不行
second me 去年就有了,技术实现上差不多,但当时没火。就像电车早于汽车出现,但电池不够大的时候,什么都做不了
我问:三到五年后,WorkBuddy 做成了,你觉得跟今天做对了什么有关系
他说:不停跟进最先进的东西,然后最快给到用户
「去年能看到今年是这个样子吗?我根本看不到三年之后会是什么样子」
他把 WorkBuddy 未来的方向定义为「想法变现实的工具」。code agent 是把想法变成代码,未来这个层次会不停提升,从代码到网页到应用
「未来什么代码不是全都由 AI 写的呢」
如果算力足够、模型足够强、computer use 成熟,所有软件都可以被 agent 操作。那软件的前端为什么还要由开发者统一提供?用户自己跟 AI 说一下,界面变成你想要的样子就好了
这都有可能。但说实话,现在说这些,谁也不确定
下班,意味着开工
以前下班就意味着关电脑、结束一天的工作
而未来,下班前的最后一件事可能是给 Agent 布置今晚的任务
李超说他有段时间下班前最怕一件事:agent 正在跑一个长任务,中间卡在一个 plan 确认上。走不了。等它 plan 完再走。「说那个等我一起下班」
现在有了手机端,他终于可以心安理得地走了。回家路上看一眼手机,点个确认,agent 继续干
「因为是做 AI 的,我经常想下班前一定要发一个很长的 prompt 让它去执行,不然感觉这个班就白下了」
以前下班关电脑。现在下班给 agent 开工
这大概是这个时代打工人最诚实的写照了
聊到快结束的时候,我们还吐槽了个:是不是之后也很难区分在家、在办公室以及办公之间的界限了?不仅工作意义上无法区分,甚至可以用 Claw 帮着打卡。
他自己说完补了一句:「这个能不能写」
我说:「好」
然后一层一层的想下去:员工让 AI 写周报,老板让 AI 读周报。员工让 agent 干活产出代码,老板让 agent review 代码。群聊里所有人都在热火朝天地讨论
然后大家在楼下咖啡厅碰见了
真是个赛博的世界
WorkBuddy 下载地址 https://www.codebuddy.cn/work/ Web 端 国内版 https://www.codebuddy.cn/agents/ 国际版 https://www.codebuddy.ai/agents 新用户注册送 5000 Credits,无门槛 https://www.codebuddy.cn/profile/usage
热门跟贴