大家好,我是袋鼠帝。
不知道大家有没有发现,随着AI的发展,token这个东西居然还变得越来越贵了。
豆包之前完全免费,现在推出了收费版;Anthropic前段时间也上调了Claude API的价格;各种Coding Plan涨价的涨价,限量的限量,有些你甚至都抢不到。
那,是算力变贵了?还是大家前期烧钱铺用户,现在到了收割的阶段了?
经过我的调查,token变贵的直接原因可能是需求的几何级爆发。有数据显示,中国日均token调用量到2025年底已经超过140万亿,相比2024年初的1000亿,增长超过1000倍。AI Agent兴起之后,尤其是小龙虾爆火以来,Token消耗量更是与日俱增。
需求决定价值,需求越大,就越贵。没毛病。
然后我发现当我给大家安利便宜的coding plan套餐,评论区马上就有人说:"要用就用最贵的模型,便宜的模型浪费的时间,得不偿失。"说得很有道理。
但我之前写贵的模型的时候呢,又有人说"给Agent用这么贵的模型,你富二代吧?",写国产模型呢,又说不如国外的。
有时候我是真没招了,兄弟们。
既然这样,那就换个思路:直接从Agent上面来降低token消耗。
不管你用什么模型,这次咱们从技术上、从根源上,解决大家的token焦虑。
最近有个开源项目叫OpenClacky,还挺值得看一看的。
OpenClacky是一个既能省钱,又能赚钱的开源AI Agent,它对MiniMax、Claude、DeepSeek、GPT、Kimi等十几套模型API都做了响应格式和调用链的适配优化。
省钱的奥秘就两个字:缓存。具体来说,是上下文调优 + 接近100%的Cache命中率。
我看聪哥(@刘聪NLP)前两天也写了一篇文章安利:
无奖竞猜,照片中哪个是我
我还去评论了,然后聪哥就叫我也写写。emmm,好吧,写就写,主打一个听劝。
省token这块,它有2个让我印象很深的点:
16个工具跑赢52个工具:OpenClacky只用了16个核心工具,而Hermes有52个,Claude Code有40多个。工具越多,每次请求都要带更重的schema,你没用到的工具也在上下文里消耗token。OpenClacky的做法是,核心工具集保持极简,其他能力全交给Skill,需要什么调什么,不用的时候不占位。
读500行代码比读1000行更贵:这是创始人团队实测出来的。做coding agent的时候,最吃token的是读大文件。他们试了200行、300行、500行、800行、1000行,最后发现1000行是最优解,一次读够,AI翻一翻就找到要的东西。500行反而因为信息不够,AI要反复多读几次,成本直接翻倍。
全是反直觉。
实测数据有三项真实任务横评,OpenClacky总成本基本就是龙虾的1/3,爱马仕的1/6。
其实省token只是第一层好处。
OpenClacky真正让我眼前一亮的,是它在省钱之外做的另一件事:
变现。以复利的方式变现。
我逛OpenClacky官网的时候,看到一个概念,有点意思:
"把你的专业技能做成一只能挣钱的龙虾"。
什么意思呢?
如果你有专业知识,OpenClacky可以帮你把它变成产品。
大多数专家面临同一个问题:知识无法规模化。
你帮一个客户,收一份钱。帮一百个客户,就需要一百倍的时间。知识本身没有复制性:除非你把它变成软件产品。
但做软件需要时间,需要维护…那条路还是有点太重了。
OpenClacky提供了另一条路:把你的方法论变成Agent Skills,一次创建,无限交付。也就是相当于把自己的时间打包成多份,来售卖。
这就是所谓的"复利",当然,并不是所有产品都能达到这种效果,一定要找到长期,且持续的刚需!
我研究之后发现,OpenClacky是搭建了一整套license激活码的变现系统。
首先是你把自己的Skills打包好,创建一个龙虾分身,对外提供服务
可以发布自己的skill来赚钱,暂时没有自己的skill也没事, 平台提供了一些原有的skill可以直接供你组合发布成龙虾
生成授权码,发布自己的龙虾
你的龙虾发布之后,用户有多种渠道可以安装你的龙虾(如下图)。比如能直接下载安装包,或者通过指令,甚至还能嵌入到你现有的网站中
比如通过指令安装袋鼠帝龙虾
安装完成后可以访问一个OpenClacky的WebUI页面
用户付费后获得激活码,拿着激活码就能激活你的Agent去使用。
激活码有有效期,时间一到,使用权回收,你就可以按时间定价收费。
那,激活码又是哪里来的呢?
在发布自己的龙虾(Agent)之后,有10个免费的License可以先用起来,一个License对应一个激活码,一个激活码,对应一个用户的年费。
License用完之后需要跟平台签约获取更多license(看了下文档,签约后是3/7分成,创作者7)。
不过,我暂时还没找到用户付费的入口,定价那块应该还在完善中。但整个变现逻辑已经趋于闭环了。
说实话,这一套东西如果自己搞,还真不好弄。
去年我做微信AI助手的时候就尝试过激活码变现,按月的按年的,用户付费后拿激活码激活软件。整套流程是跑通了,但自己维护这套激活码系统真的累。因为你还要去研究各种加密,以及完善激活码的判断流程,还有维护服务器等等...
OpenClacky等于帮你把这套变现的基础设施给做好了。
肯定会有人问,那钱真的有这么好赚吗?
我觉得核心还是要找到刚需
然后我也给想做Skill变现的朋友提供一个思路:
你不需要一上来就做一个完美的付费Skill。
你先开源,让大家免费用。当你的某个开源Skill能够突破比较高的Star数,说明它确实解决了真问题,你再基于它做一个优化版、增强版,然后通过OpenClacky来做收费。
先开源去试错,通过市场反馈找到刚需,再把验证过的东西做成产品。 这也是很多开源项目的经典玩法。
而且OpenClacky的加密Skill功能可以让你不暴露自己的Skill内部提示词,直接用激活码的形式打包分发。这意味着你的方法论,不管是律师的审合同流程,还是龙虾分身,都可以安全地变成产品。
如果大家还有更多的变现小技巧,欢迎评论区一起交流分享。
它又能省token,又能赚钱,那这东西本身到底好不好用呢?
下面聊聊我这几天使用OpenClacky的感受,顺便展示几个我跑的案例。
先说安装和日常体验
OpenClacky方便是真方便,支持Mac和Windows,一键下载,一键打开WebUI,巨省心。
OpenClacky这块感觉立省五百块钱安装费
WebUI感觉比龙虾的好使,支持随意开多个会话。
定时任务可以随意编辑和立即测试,Agent还支持自动化操作浏览器、接入飞书。旁边的任务管理处可以看见定时任务详情。
还有一个小细节:OpenClacky每轮思考和工具调用,都会单独标注出花了多少钱。计费很透明,这让我每次跑任务的时候心里有数。
B站热门视频榜单获取做成PPT
我想看看OpenClacky的内置技能到底好不好使
它还会问我要邮箱,说可以每日自动发送日报。
但我想让它做成PPT,不走邮箱,看看它能不能灵活应对。
结果,成功输出了PPT。虽然我直接改了Skill的步骤,折腾了好几轮,最后一共花了0.4美刀(用的Sonnet 4.6)。
美感还行,而且我去核对了,确实是当前的B站热门榜单,完全一致,播放量、点赞投币收藏、视频封面、弹幕数量,都抓到了。数据准确性没问题,中途变需求也能接住,还不错
中国上空航班实时显示图
天上飞过一架飞机,突然想做一个实时航班图。这个案例我想试试OpenClacky结合Opus 4.7,能不能搞定一个涉及OAuth认证、API调用、地图可视化、定时刷新的复合任务。
我注册了一个OpenSky Network的账号,给了它client_id和secret,prompt里详细描述了我要的效果:
深色背景地图、飞机按真实经纬度和航向显示、按高度三色分档、30秒自动刷新、带飞行轨迹。
一次性就做出来了。花了5刀(Opus 4.7确实贵),但出来的效果让我没话说。Leaflet.js地图上密密麻麻都是✈️图标,点任意一架就弹出呼号、国籍、高度、速度,每30秒所有飞机位置刷新一次,右侧还有来源国籍Top5排行榜。
之前用别的Agent做过类似的事,基本都要来回改好几轮才能跑通。这次一轮过,有点意外。
所以,我感觉OpenClacky除了省token外,任务执行效果还是很不错的。
持仓股票日报(定时推送到飞书)
然后在看看OpenClacky的定时任务能力,每天一次。
最近想看几只股票:贵州茅台、比亚迪、宁德时代、中芯国际、阿里巴巴。
发现OpenClacky有财经新闻技能,既然已经接入了飞书,我就想让它每天抓取财经新闻,分析市场行情。每天能感知一下市场情绪,还是不错的。
/cron-task-creator 每天早上9点执行一次,帮我完成以下任务:
打开新浪财经(finance.sina.com.cn),分别搜索以下5只股票的今日最新新闻,每只至少读取3条:贵州茅台(600519)、比亚迪(002594)、宁德时代(300750)、中芯国际(688981)、阿里巴巴(09988)。
读取完所有新闻后,结合每只股票当前股价和近期涨跌幅,对每只股票给出一个判断,判断格式固定为以下三种之一: 建议关注(利好信号)、 注意风险(利空信号)、➡️ 暂时观望(无明显信号)。
然后把所有内容整理成一份日报,通过飞书发送给我,内容用 Markdown 格式,结构如下:
# 股票日报 YYYY年MM月DD日
## 贵州茅台 600519
**今日判断:** 建议关注
**核心新闻:** 一句话总结今天最重要的一条新闻
**理由:** 两三句话说明为什么给出这个判断
## 比亚迪 002594
...(以下每只股票格式相同)
## 今日总结
一句话说今天整体市场情绪偏多还是偏空
如果某只股票今日没有找到相关新闻,注明"暂无新闻"并给出➡️ 暂时观望。
很快就做完了,推送到我的飞书上。
可以上下滚动的图片
可以每次准时收到,很满意,而且各方面分析都有。
「最后」
OpenClacky让我看到了Agent赛道一个新的可能性。
过去我们聊Agent,首先想到的就是它的效果,"它能干什么"。龙虾能干,爱马仕也能干,Claude Code、Codex更能干。
当Agent发展到一定的时期,优化token的使用,节省token这件事是一定会被拿出来聊的。
我们使用Agent,对于个人还好,但对于企业来说,token成本是巨大的。
如果能在每一次调用中都节省哪怕一丢丢,那么总的算下来,应该能为企业节省非常大的开支。
OpenClacky在省token这件事上确实做到了差异化。这对于企业来说很有价值,但让我更兴奋的是Skill变现这条线。
把你的方法论变成产品,用开源试错找到刚需,再用license做复利变现。
通常,你想把知识变成产品,得写课、做培训、开SaaS,每一条路都很重。现在,你可能只需要一个Skill。
我的cangjie-skill已经打包上去了。到底能不能跑通这条路?
我也在摸索。但至少,一个新的可能性打开了。
我是袋鼠帝, 一个致力于帮你把 AI 变成生产力的博主。我们下期见~
能看到这里的都是凤毛麟角的存在!
如果觉得不错,随手点个赞、在看、转发三连吧~
如果想第一时间收到推送,也可以给我个星标⭐
谢谢你看完我的文章~
热门跟贴