自打人类开始死磕人工智能助手这个赛道之后,大家可以说是真没少折腾...
前年大家都在疯狂背诵怎么写提示词,生怕自己跟不上时代的步伐;去年大家又开始到处搜罗好用的单体Agent,想着给自己找几个免费的赛博打工人,路线是越卷越离谱。
折腾到最后,大家发现光靠一个Agent单打独斗,这体验好像快到天花板了。但你要说多准备一些Agent和Skills,自己又会莫名其妙变成了包工头,每天一睁眼就是给十几个不同的AI工具分配任务。
这哪里是解放生产力,简直是给自己找了个爹。
就是说,有没有一种可能性,让我们给数目茫茫多的Agent找个管事的,让他们能够自己规划、完成工作呢?
LobeHub也是这么想的。
(图源:X)
5月18日,开源AI项目LobeHub在X上宣布最新的更新动态——Chief Agent Operator,全称叫作首席智能体运营官,号称能够帮助用户自主招募几百个Agent,给你组建一支无休止运转的专业团队。
好家伙,时代变了,AI直接翻身做主管了?
赛博包工头,体验很骨感
先给村里刚通网的兄弟们简单科普一下LobeHub的背景。
这玩意原本是个在开源社区还蛮火的Agent整合交互项目,在那个满是脱发大佬的 GitHub 平台上,它硬是狂揽了快八万颗星,绝对是开源圈子里的顶流选手。
(图源:Github)
主打功能也很简单,就是把各家大模型以及用户能部署的Agent整合到一个界面。
比如什么Codex、Claude Code、OpenClaw、Hermes Agent啊,只要部署好了就能接入这个统一入口,甚至能够统一管理需要用的Skills和外部服务端口。
正所谓三个愿望,一次满足。
(图源:LobeHub)
但这帮开发者明显嫌只做个好看的整合UI太没挑战性了,于是掏出了这套名叫CAO的终极调度系统。
按照官方那套宣传,你现在彻底不用费劲巴拉地去背什么提示词、找什么Agent了。
你现在的身份,是躺着指挥赛博打工人的大老板。
比如你甩给CAO一个任务,帮我把全网关于某款新能源车的评测都扒下来拉个表格之类的。CAO接到命令后,就会从库里直接调动几十万种技能模板,瞬间把干活的Agent小弟拉满,然后安排这帮家伙在云端疯狂并行处理。
你呢,只需要把手机一锁,安安心心去睡个大头觉,第二天早上查收一份CAO恭恭敬敬递上来的每日简报就行。
听起来是不是爽到天灵盖了?反正我是听到这个消息立刻就去尝试了。
(图源:雷科技)
正如大伙看到的,这次的需求还是比较简单的。
在收到需求后,LobeHub很快便调用Agent Management工具,并对我提出了明确一系列参数的需求。
(图源:雷科技)
在我明确需求后,很快呀,一支专业团队就搭建起来了。
(图源:雷科技)
整体搭建时间还不到四分钟,而且团队的分工、安排都是比较明确的,每个都有自己的名字和职责,而不是一个什么都要干的“全能选手”。
那接下来,就该放手让它生成,看看效果如何了。
哈哈,骗你的,结果是失败,而且是周而复始的失败,不断尝试不断失败,需要你点一万次确认批准的那种失败。
(图源:雷科技)
直到最后,终于有点新东西了...怎么是没额度了?
(图源:雷科技)
说点难听的,这一波体验多多少少是把我本来的期待感给盖下去了,有没有气笑真不好说,脸上的表情是直接绿了。
虽然我很想给大家找一个成功的案例,但目前海外社媒上根本就没有用户成功过。
比起成功的案例,反而是有不少网友吐槽这玩意的上手门槛高得离大谱,自动任务算力消耗过于迷惑,简直是在给各大模型厂商疯狂打钱,在长任务链的情况下甚至还存在让人血压狂飙的链式翻车问题。
把任务完全甩手给CAO,就像是把一辆没装刹车的跑车交给了刚拿驾照的新手,只要第一个Agent理解错了,给第二个Agent传了错误指令,最终你就很可能得到一个风马牛不相及的成品。
(图源:雷科技)
用这玩意来办公,你第二天收拾烂摊子的时间,可能比自己从头手打还要多得多。
散养AI?还早得很呢
看着大家疯狂吐槽LobeHub的CAO ,小雷心里有一种极度强烈的既视感。
其实这种让AI去管AI的全自动化思路,并不是LobeHub一家独创。经常看雷科技评测的老粉可能还有印象,我们在去年七月份就体验过一款类似的应用,名字叫MasterAgent。
我们当时的初衷特别淳朴,就是想搞个全自动写报告和鼓捣PPT的赛博打工人,好让我们能腾出时间去楼下多买几杯咖啡。
结果嘛...虽然中间也有磕磕绊绊,但最终成品还是轻松暴杀了LobeHub的CAO。
(图源:雷科技)
当然了,MasterAgent也有自己的问题,比如自动收集的资料时间不对,或是几个Agent互相推诿扯皮不干活,甚至还会产出一些格式敷衍、内容简短的报告。
但只要及时介入,它最终端出的成品是能让人满意的。
注意这里的关键词:介入,就我目前的实际体验来看,想把AI彻底散养,确实还是太科幻了点。
然而,不管是去年的国产先驱MasterAgent,还是现在爆火的LobeHub CAO,它们所勾勒的蓝图都在极尽所能地减少人类插手的成分,似乎用户真的只要在睡前发个指令,第二天早上就能得到一份心满意足的成果。
(图源:LobeHub)
不是哥们,工作不是这么好做的。
不同于一问一答的对话式Agent,CAO这类应用很难做到有求必应,你按下一键启动,就像是按下了火箭发射的倒计时按钮,只能眼睁睁看着这玩意轰鸣着升空,并在心里默默祈祷它千万别在半空中炸成一朵大烟花。
而我的这次尝试,可以说就是因为燃料不足而坠机了。
然后痛苦的地方来了,因为工作大纲是CAO分配的,中间的代码是底层Agent写的,外部数据接口是另一个Agent调用的。面对一个接近黑盒的执行过程,你、我、他最后大概率根本找不到到底是哪个Agent捅了篓子,唯一的解决办法只能是把整个任务推倒重来。
(图源:雷科技)
我甚至还遇到了看不到技能调用的BUG,就更别提怎么去排查了。
其次,过度依赖这种应用,还会带来严重的同质化隐患。
当市面上所有公司的内容运营、代码开发甚至市场调研报告,都是由几个开源CAO带着差不多的Agent小弟流水线般产出的时候,互联网上充斥的可能全都是千篇一律的标准模板和缺乏灵魂的废话。
啧啧啧,真有点不敢想象那样的未来。
说在最后
不过话说回来,吐槽归吐槽,这并不能阻挡历史的车轮向前碾压。
就像当年有了全自动洗衣机,搓衣板便很快被淘汰了那样,不管中间会经历多少次翻车,不管人们会为了调教这个应用掉多少根头发,将繁琐的执行和分配工作交给全自动化管理系统,已经是整个硅谷和国内科技大厂都在疯狂押注的明天。
人类在追求变懒这条路上,从来就没有停止过探索。
至于那些担心自己会被CAO抢走工作的...说到底,CAO不是一个真实的岗位,甚至算不上什么新鲜概念,只能说科技圈造词的速度还是太权威了。
(图源:LobeHub)
而且这玩意和CGO(首席增长官)、CTO(首席Token官)还不一样,那俩起码算是真实存在的岗位。
前者嘛,本质上就是CMO(首席营销官)换个写法,后者就比较扯了,我也找不到几个设有该岗位的正经公司,只能说在这个时间点,大部分企业还用不着精细化管理Token用量的人。
至于你说,面对CAO这种满天飞的新概念,咱们到底该怎么对待?
我是觉得大伙千万别被大厂的造词运动给PUA了。不管它是C啥O,本质上就是一个还在试错期的复杂高级工具。极客大佬大可以去折腾,普通人老老实实用好最基础的聊天框就行。
等这玩意哪天真的不乱烧钱也不发疯了,咱们再安心上车也不迟。
热门跟贴