打开网易新闻 查看精彩图片

先说结论,经过我一段时间的测试,我选择将workbuddy作为主力员工,完成主要工作,将qclaw作为备选,基本放弃了kimiclaw、arkclaw。

模型

AI大模型

使用体验(方便)

价格

评分

kimiclaw

⭐️⭐️⭐️⭐️(kimi2.5,擅长推理、写作)

⭐️⭐️(访问工作结果比较复杂)

⭐️(199元/月)

⭐️⭐️⭐️

arkclaw

⭐️⭐️⭐️(模型自配)

⭐️⭐️⭐️(类似聊天机器人,没有工作结果)

⭐️⭐️(59元/月+自购算力存储)

⭐️⭐️

workbuddy

⭐️⭐️⭐️⭐️⭐️(可以配置kimi、GLM、Minimax、Deepseek等多个模型)

⭐️⭐️⭐️⭐️⭐️(左侧工作过程,右侧工作结果,清晰明了)

⭐️⭐️⭐️⭐️⭐️(赠送token,升级会员后也有token)

⭐️⭐️⭐️⭐️⭐️

qclaw

⭐️⭐️⭐️(默认模型,疑似元宝)

⭐️⭐️⭐️⭐️(受制模型,经常出现弱智情况)

⭐️⭐️⭐️⭐️⭐️(每天送token,相当于免费)

⭐️⭐️⭐️

有了龙虾以后,用AI组建一个团队还叫个事儿?

真做起来发现,还真是个事。

无论是ChatGPT、Gemini、Claude,还是千问、deepseek、kimi、智谱、豆包,随便拎一个出来,工作能力没毛病,还不瞎逼逼,随随便便秒个正常员工。

问题是成本。

我也想让V神、Ilya、Karpathy给我写代码,咱不得考虑成本?能花1块钱赚5块钱,为什么要花2块钱赚5块钱?

Claude、Gemini好是好,但要懂科学上网,使用成本高,先去掉。

千问、deepseek、kimi、智谱,还有豆包、minimax,单一能力都不错,但他们都还是大脑,想干活还得综合评估国产龙虾和他们的适配性,以及价格。

没错,这是我踩的第一个坑。

第一坑:199块买的kimiclaw,像个不给结果的学霸

一开始,我怒花199元买了kimiclaw一个月的会员。

选择理由很简单。身边好几个人把kimi2.5评为能力最强的国产AI大模型,而要体验kimi2.5需要先成为会员。那段时间知乎、B站上大量kimiclaw评测,都指向云端操作,避免了本地运行的风险,整合了大量skill,不需要安装直接使用。

也就是说,只要199,我不仅能体验kimi2.5,还能完美解决数据泄露、使用成本高这两个我最担心的风险。

199,便宜!

结果kimiclaw给我拉了坨大的,用"强大"的产品能力完美避开了这两大优势。

决定性测试:改写小红书内容

我要求kimiclaw把一篇关于"赛博摆摊"的内容改写成小红书风格。这是我最常用的场景,也是我组建AI团队的核心需求。

kimi很快完成了。给出了修改要求、标题、内容架构,还告诉我可以直接发布。

打开网易新闻 查看精彩图片

但我翻遍整个对话,唯独缺了发布的内容。

打开网易新闻 查看精彩图片

我问:内容呢?

打开网易新闻 查看精彩图片

kimi说:我已经按照您的要求完成了改写,包括标题、结构和要点。

打开网易新闻 查看精彩图片

我再问:

打开网易新闻 查看精彩图片

我再问,还是一样。

打开网易新闻 查看精彩图片

kimiclaw就像一个工作能力非常出色的员工,你要求什么他都能完成,但偏偏不把结果给你。无论你怎么追问,他都回答"我完成了呀,你看我完成的过程"。

问题是老板要的是结果,不是过程。

然后就是

找不到的skill

kimiclaw宣称内置大量skill,但你根本不知道他内置了什么,怎么唤醒、怎么安装。

打开网易新闻 查看精彩图片

有时候他明明告诉你安装方法,你接着问,他会给你各种答案,推荐各种安装方式。你想安装的时候,偏偏安装不了,还经常报错。

打开网易新闻 查看精彩图片

kimiclaw就像一个炼金术师,创造了各种宝物,然后把宝物藏起来,给你一份藏宝图,告诉你有缘自然会见到。

咱想找个员工,不是找个祖宗。

我直接把kimiclaw拉进了黑箱子(bushi:毕竟花了199,起码要物尽其用一个月)。

第二坑:59块买的arkclaw,会员只是入场券

在试用kimiclaw的过程中,我又看到了arkclaw的广告。

字节不是一直以产品能力强著称吗?产品体验应该可以吧?

我花了59元买了一个月会员。

结果会员就是会员,只能使用类似豆包的chatbot功能。他的记忆基本等同于鱼,每次布置任务还需要先交代背景,训练一下基本素养。

要想像正常龙虾那样干活,还需要买存储、买算力,再自己配置。

打开网易新闻 查看精彩图片

不仅麻烦,支出还更多。

arkclaw也拉进了黑名单。

柳暗花明:WorkBuddy的意外之喜

就在我山穷水尽、继续死磕kimiclaw的时候,柳暗花明了。

看到腾讯布局龙虾的新闻,介绍了workbuddy。我一想,对呀,不光字节做产品有一套,腾讯也行啊,那就试试。

万万没想到,workbuddy完美契合我的需求。

决定性测试:同样的改写任务

我还是用那篇"赛博摆摊"的内容,要求改写成小红书风格。

workbuddy不仅给出了改写完的完整内容,还直接显示在结果页面。我不需要费劲脑汁去寻找文件到底在哪里,不需要在对话里翻来找去。

打开网易新闻 查看精彩图片

结果就在那儿,一目了然。而这种体验配合AI大模型,那就更爽了。

GLM的写作能力

workbuddy自带kimi2.5、GLM5.0、Minimax等国内最顶级的AI大模型。

打开网易新闻 查看精彩图片

我的测试里,GLM在文字写作方面的能力非常突出。用我同事的话说,怀疑GLM用大量公文做了训练。

事实证明,GLM大模型的能力相当可以。不仅可以对现有资料进行解构,还能完善思路,产出相应的内容。

打开网易新闻 查看精彩图片

找得到的skill

workbuddy还做了个技能模块,可以直接找技能。(PS:我特别不理解,这么简单的事情,为什么kimi做不到?)

打开网易新闻 查看精彩图片

零成本

最后,也是非常重要的,workbuddy还在送token阶段。注册就送,每天登录都送token,还经常送一些token。

截止目前,我还没花一分钱。

WorkBuddy+GLM基本成为我的首选。

备选方案:qclaw

在使用workbuddy过程中,我还试用了微信龙虾qclaw。

试用下来,qclaw特别割裂,他既保留了龙虾的极客设定,又在努力迎合普通人,因此,有时候qclaw像正常的龙虾,能有不错的回复,有时候又像个傻子,就比如下图

打开网易新闻 查看精彩图片

再加上qclaw默认模型很可能是能力不足的元宝,就让这种情况经常出现。

打开网易新闻 查看精彩图片

但好在现在qclaw每天赠送免费token,一些基础的定时任务还是可以用的,再加上张小龙滤镜(还是要期待奇迹的),我选择将qclaw设定为备选龙虾。

总结一下

经过一系列的试用分析,我选择将workbuddy作为主力员工,完成主要工作,将qclaw作为备选。

核心标准就一条:性价比。

能花1块钱办的事,不花2块。能免费办的事,不花钱。

真金白银,才是检验一切的唯一标准。

确定了团队,那要开始分工,各就各位,干活赚钱了吧?关于分工,我倒是有自己的思考,网上很流行一种按技能分工组建团队的方法,比如设定市场、文案、产品、设计等职位。

一年前,我们之前在做agent的时候,也用过这种方法,在使用过程中,我们发现这种结构不仅复杂,还特别浪费token,于是我就想团队之所以分工,是不是人能力、精力的限制,既然有了无所不知且只消耗算力的AI。

我们是不是该有点AI思维,换一种分工方式?就 比如按任务分工。

关注我,我接下来将按这种思路继续体验。

有兴趣体验workbuddy的可以扫码试试,也帮我薅点token

杨泽是谁?

·《潮流:品牌引爆、出圈背后的秘密》、《产品冷启动》作者。

·就职过互联网大厂,曾负责脉脉、Totok等多个细分市场产品从0到1增长工作。

·资深品牌架构师。对外经贸大学、阿里巴巴UMIC课堂、36Kr Eclub特邀讲师。

·人人都是产品经理、虎嗅、techweb专栏作者,曾出版《精益营销第一课:产品冷启动》