打开网易新闻 查看精彩图片

前几天,我统计了一下各种Agent的token消耗账单。

心理有预期,但还是有点吓到我了。知道自己花了钱,但不知道花了这么多,甚至想不起来都花在了哪......

我身边的养虾人、养马人也是一样,经常吐槽某个任务又花了多少token。更多人一开始兴奋安装,惊喜试用,几天后默默关掉。不是不好用,是真不敢一直用。每次让Agent干活前都得想,这次又要烧多少token?

这两天,我终于发现了一个在意咱钱包的Agent,叫OpenClacky。主打一个省token,并且能力对齐最强智能体Claude Code。

打开网易新闻 查看精彩图片

同样三个真实工作任务,同一个模型,同一套Skill,同一时间段跑完。OpenClacky总花费5.10美元。对比之下,OpenClaw花了15.70美元,Hermes Agent花了30.14美元。

也就是说,干同样的活,OpenClacky的账单是Hermes的六分之一,OpenClaw的三分之一。

甚至比公认全球顶级的闭源产品Claude Code还便宜一点点,上面的任务CC是5.49美元。

打开网易新闻 查看精彩图片

这不是一个"便宜但能力打折"的故事。它的任务完成质量和Claude Code在同一水平线上。

比如做一个商务PPT,这是OpenClacky做的:

打开网易新闻 查看精彩图片

这是CC做的:

打开网易新闻 查看精彩图片

怎么样,难分伯仲吧。

下面带大家实测一波~

安装贼方便,在官网下载客户端,有技术基础的小伙伴可以直接命令行安装,https://www.openclacky.com/#install。

然后选择供应商,输入对应的key就搞定了,全程无卡点,比OpenClaw安装容易太多了。

还有一个好处,就是可以直接选择OpenClacky官方供应商,提供了各家顶级大模型,不用担心被封,不用来回切换API,非常之方便。

我们让它做一个品牌视觉设计公司的网站。

打开网易新闻 查看精彩图片

整个任务执行过程,很丝滑。一是速度非常快,只用了两分钟。二是执行中没有暂停,一步到位,用出了通用模型的省心感。三是UI设计舒适,主次分明,让你能直观看出执行细节和进度。

比较特别的一点是,执行过程中的每一步,以及完成后,都会标出具体花费。不是算不明白的token量,是美元。再也不用盯着模型后台的余额了。

做一个完整的网站UI,只花了2刀。而且对比OpenClaw,真的省心。说实话,用OpenClaw做任务很磨人,用过的都知道。

我们看看效果:

打开网易新闻 查看精彩图片

不错吧,整体设计很有活力,功能完整,动态效果也蛮搭配的。

再来做一个很烧token的任务,获取AI前沿资讯。

给OpenClacky一份我常浏览并能成功爬取的资讯网站,让它获取3日内的AI资讯,并制作一个公众号选题表。

打开网易新闻 查看精彩图片

这个任务看似简单,实则很繁琐,成功率也难以保证。因为每个网站的安全机制不同,要想获取信息可能会尝试RSS、Crawl4AI、Headless Browsing等多种抓取策略,并且信息量很高,很考验Agent的执行策略和严谨度。

OpenClacky成功抓取了27个网站,对比其他Agent,这个成功率已经算很高了。

打开网易新闻 查看精彩图片

重要的是,竟然只花了不到2刀!我用OpenClaw,这个任务一般花费在20刀左右,差距着实有点悬殊。

打开网易新闻 查看精彩图片

而且效果很顶,之前用OpenClaw,会忽略很多资讯,数量通常在20条左右。OpenClacky抓的挺全,46条,基本没有错误。

反正几轮体验后,我是打算投奔OpenClacky了。

那OpenClacky咋做到便宜又好用的呢?

先说一个反直觉的事实:Agent贵,往往不是因为模型贵,而是上下文管理的粗糙

每次你跟Agent对话,它都要把之前的对话历史、系统提示词、工具描述一股脑塞给模型。如果这些内容能命中缓存,你只需要付很少的钱。如果命中不了,你就在为重复的信息反复买单。

就好比你每天去同一家咖啡店,但每次都要说一遍美式、全冰、无糖、打包。

这就是OpenClacky做的第一件事,是把缓存命中率逼到接近100%

创始人李亚飞在访谈里说了一句话:缓存命中率不是调出来的,是设计出来的。

那是咋设计的呢?核心原则只有一条:Session不重启,系统提示词不变。

听起来简单,做起来极难。因为Agent在运行过程中,Skill会重新加载,模型可能切换,上下文需要压缩。大多数Agent遇到这些变化,就直接重启Session,缓存全部清零,从头开始计费。

OpenClacky的做法是,把这些动态变化通过一个独立的session context机制插入对话流,而不是去改动系统提示词本身。这样一来,缓存的锚点始终有效,不会因为一次配置变化就全部失效。

它还做了一个叫"双重缓存标记"的设计。普通做法是只标记最后一条消息,但这会导致下一轮对话时标记丢失,缓存失效。OpenClacky同时标记最后两条消息,确保即使对话往前推进,缓存依然能命中。

第二件事,是工具数量的克制

你是不是每次安装Agent前,都先安一大堆Skill、插件。平时听说哪个好用,也不考虑实不实用,先安上再说。

可实际却是,Agent的工具越多,每次请求就越贵。

因为每个工具都有自己的schema描述,不管你这次用不用得上,它都会被塞进上下文里,占token。你装了52个工具,哪怕只用了3个,另外49个的描述也在默默烧钱。

Hermes Agent有52个内置工具。Claude Code有40多个。OpenClaw有23个,加上插件和MCP能到50个。

OpenClacky只有16个。

这不是因为它功能少。它的做法是把一个叫invoke_skill的元工具放在核心位置。需要什么能力,就通过这个入口去调用对应的Skill。Skill可以无限扩展,但核心工具列表始终保持精简,schema不膨胀,缓存不受影响。

16个工具跑赢52个工具。这不是少做功能,是架构层面的选择。

第三件事,是不为你的离开买单

真实场景里,没有人会连续跟Agent对话三小时不停。你会去开会,去喝咖啡,去午休。回来之后继续让它接着干活。

很多Agent在你离开的这段时间里,依然保持着完整的长上下文。等你回来,它把所有历史一股脑塞回模型,你为"等你回来"这件事付了钱。这部分浪费,可能占到整段任务成本的30%以上。

OpenClacky会在空闲期自动压缩上下文,只保留关键的任务状态、文件变化、决策过程和下一步动作。而且压缩本身也不额外开一次模型调用,而是插入当前对话流里完成,让已有缓存继续复用。

你去喝咖啡的时间,不再是token燃烧的时间。

第四件事,是把模型选择权还给用户

闭源订阅的问题在于,你既不知道它怎么计费,也控制不了它用什么模型干什么活。OpenClacky走的是BYOK路线,Bring Your Own Key。

你可以用Claude写复杂代码,让子任务走DeepSeek或者Kimi。主任务用强模型保证质量,轻任务用便宜模型控制成本。不是单纯换个便宜API,而是把任务拆分和模型选择的决策权交回你手里。

打开网易新闻 查看精彩图片

这四件事叠在一起,不是某个单项指标的极端优化,而是一种系统性的工程哲学。

李亚飞管这叫"不偏科"。不盲目堆工具,不盲目搞多Agent编排,不盲目追求某个单项数据好看。而是让真实任务的总账单降下来。

Claude Code在部分任务上的缓存命中率确实比OpenClacky高。比如PPT任务和社媒任务里,Claude Code的命中率更高。但最终用户付钱看的不是单项指标,而是总成本。成本是由请求数、单次prompt规模、工具schema、缓存命中率和任务完成稳定性共同决定的。

OpenClacky用51次请求完成了三个任务。Hermes用了218次。请求少,每次请求又轻,缓存又稳,三者相乘,自然省了不少token。

但如果OpenClacky只是一个"更便宜的Agent",这篇文章大概写到这里就可以结束了。

让我更感兴趣的是,是它在省token之外做的另一件事:Skill经济

OpenClacky想让Skill变成可以加密、可以定价、可以售卖的产品。

打开网易新闻 查看精彩图片

具体来说,一个律师可以把自己十年的合同审查经验封装成一套Skill,包含审查流程、风险判断标准、文书模板、交付规范。然后通过OpenClacky的平台加密分发,按License授权给其他律师使用。

这不是一个简单的"Skill商店"。李亚飞的说法是,OpenClacky更像创作者的技术合伙人。创作者提供行业经验和方法论,OpenClacky提供底层Agent能力、分发渠道、加密保护和升级机制。

他们已经有了一个真实案例:一位律师做的"青狮龙虾",把16个法律相关Skill打包在一起,已经卖了不少单。还有金融方向、知识管理方向的产品在陆续上架。

AI Agent上半场争的是能力。谁更聪明,谁能做更多事,谁更像一个全能助手。这个阶段的赢家是Claude Code,是各种花哨的多Agent编排。

但下半场争的是账单。

因为能力再强,如果你不敢每天开着用,它就永远只是一个偶尔请出来的昂贵工具,而不是真正的个人助理。

个人Agent的门槛,从来不是智能。是可持续使用。最好的架构,不是盲目追求复杂。而是在克制中,把每一个token都用在刀刃上。

当你不再为每一次对话心疼的时候,你才第一次真正拥有了一个Personal Agent。

别让账单,成为你和AI之间最大的距离。

官网:

https://www.openclacky.com

Benchmark:

https://www.openclacky.com/benchmark

创作者计划:

https://www.openclacky.com/creators

GitHub:

https://github.com/clacky-ai/openclacky

如果你有任何看法,欢迎在评论区一起讨论

如果有一点收获,可以点赞、转发、推荐文章,关注「AI机器人茶馆」