你有没有发现,现在很多 AI 工具越来越能干,但也越来越“会说”。
你只是问一句:
这个报错怎么处理?它能先来一段:
“这个问题通常可能由多种原因导致,我们可以一步步排查……”
再列背景、再讲原理、再铺垫注意事项,最后才告诉你真正该敲哪条命令。
有时候这很贴心。
但更多时候,你只是想要:
原因是什么?命令是什么?风险是什么?下一步做什么?尤其在 Hermes 这种 Agent 工具里,AI 经常要读文件、跑命令、查资料、回报结果。它每多说一堆客套话,就多烧一截输出 token。
今天这个项目叫 Caveman,名字很搞笑,思路很实用:让 Agent 少说废话,用更短的话表达同样的技术信息。
GitHub 上 JuliusBrussee/caveman 当前已经有 56k+ Star。项目介绍里说,它是给 Claude Code、Codex、Gemini CLI、Cursor、Windsurf、Cline、Copilot 等 Agent 用的 Skill / 插件,可以让回答变短,项目 benchmark 里平均减少约 65% 输出 token,范围大概在 22% 到 87%。这里要注意,它主要压缩的是看得见的输出内容,不是让模型少思考。
放到 Hermes 上,这个思路特别值得借鉴。
哪怕你不直接装插件,也可以把它的“干货模式”规则写进 Hermes 的项目规则或助手个性里,让 Hermes 回答更短、更直接、更省 token。
一、Caveman 到底做了什么?
它干的事并不复杂。
普通 AI 回答可能是:
这个问题很可能是由于你的认证中间件没有正确校验 token 过期时间导致的。你可以检查一下 token expiry 的判断条件……Caveman 风格会压成:
认证中间件问题。token 过期判断错。检查 < 和 <=。信息还在,包装没了。
项目 README 里给过类似例子:一段 React 组件重渲染解释,正常写法 69 tokens,压缩后 19 tokens,核心意思仍然保留。它也提供 Lite、Full、Ultra、文言文几种强度,Lite 保留正常语法,只删废话;Full 更短;Ultra 接近电报风;文言文模式则更偏趣味玩法。
这很适合技术场景。
比如:
解释命令;
排查报错;
检查依赖冲突;
总结日志;
列出改动风险;
给出下一步操作;
做代码审查;
生成提交说明。
这些场景最怕一大段漂亮话。
你需要的是结论快、命令准、风险清楚。
二、它省的是什么 token?
这里要讲清楚,别把它神化。
Caveman 主要省的是 输出 token。
也就是 AI 最后吐出来给你看的文字。
它不会减少模型内部的推理消耗,也不会让模型“少动脑”。项目作者在相关讨论里也强调过,它针对的是可见回答里的铺垫、寒暄、修饰和重复解释。
所以它最适合解决这类问题:
回答太长;
总结太啰嗦;
每次都先客套;
同一个风险反复说;
命令前后包一堆解释;
审查意见写成小作文。
它不适合拿来压缩所有任务。
如果你让 AI 学一个全新概念,或者让它给刚上手的朋友写详细教程,回答太短反而会影响理解。
我的建议很简单:
日常技术协作:Lite熟悉项目以后:Full只要自己看结果:Ultra写教程、写说明、给别人看:慎用三、Hermes 怎么用?直接装这个 Skill既然是 Skill,那最舒服的方式就是直接装进 Hermes。
先在终端里搜一下:
hermes skills search caveman看到结果后,先别急着装,先看详情:
hermes skills inspect caveman确认来源、说明和安装命令没问题,再安装:
hermes skills install caveman如果你在 Skill Hub 页面里看到的卡片命令是带路径的,比如类似:
hermes skills install <某个来源>/caveman那就以卡片底部显示的命令为准。Skill 市场里的命令最稳,不要自己乱猜名字。
装完以后,可以检查一下:
hermes skills list看到 caveman 出现在列表里,就说明装好了。
接下来进入 Hermes:
hermes chat在会话里可以这样开启:
/caveman如果你只想轻微精简,建议先用 Lite:
/caveman lite这是最适合日常使用的一档。它会删掉客套话和绕圈表达,但句子仍然比较正常,读起来不费劲。
如果你已经很熟悉当前任务,只想要更短的技术结论,可以用:
/caveman full如果你只想自己快速看结果,不在乎语气和完整表达,可以试:
/caveman ultra不过我不建议一上来就 Ultra。它会压得很狠,适合熟悉项目的人自己看,不太适合拿去给别人看。
想恢复正常输出,可以输入:
normal mode或者:
stop caveman最推荐的新手顺序是:
/caveman lite先用几轮,看看回答是不是更短、更清楚。如果觉得还啰嗦,再切到:
/caveman full别一开始就把输出压到最极限。省 token 是好事,但看不懂就得不偿失。
四、装完以后怎么用才最舒服?
Caveman 最适合搭配这种任务:
解释命令;
排查报错;
总结日志;
检查文件改动;
生成提交说明;
整理安装步骤;
列出风险和下一步。
比如你可以这样问:
/caveman lite请解释这个命令的作用,不要执行:npm install理想输出应该更像这样:
作用:安装 package.json 里的依赖。会改:node_modules,可能改 lock 文件。风险:版本变化可能导致启动异常。下一步:装完跑 npm run dev 或 npm test。排查报错时可以这样写:
/caveman lite请分析这个报错。输出格式:结论:可能原因:验证命令:风险:下一步:检查改动风险时可以这样写:
/caveman full请检查这次文件改动的风险。只输出:1. 高风险2. 中风险3. 低风险4. 建议验证命令整理安装步骤时可以这样写:
/caveman lite请整理这个工具的安装流程。只保留:环境要求安装命令最小测试成功标志常见坑这个 Skill 的价值就在这里。
以前 Hermes 回答像“技术说明书”,现在更像“排查工单”:
结论是什么命令是什么风险是什么下一步是什么对经常让 Hermes 查资料、看文件、排错、跑命令的用户来说,这种输出更顺手,也更省输出 token。
五、不建议什么时候开?
别把 Caveman 当成万能默认模式。
这些场景不建议压得太狠:
给新手讲概念;
写完整教程;
写对外说明;
写客户邮件;
解释复杂原理;
做安全风险分析;
需要完整上下文的任务。
遇到这类任务,可以先切回正常模式:
normal mode或者直接说:
这次请详细解释,适合新手阅读。我的建议是:
日常技术协作:/caveman lite熟悉项目排错:/caveman full只给自己看结果:/caveman ultra需要详细教学:normal mode这样用最舒服。
六、哪些场景最适合? 1. 解释命令
请用干货模式解释这个命令:npm install理想输出:
作用:安装 package.json 里的依赖。会改:node_modules,可能改 lock 文件。风险:版本变化可能导致启动异常。下一步:装完跑 npm run dev 或 npm test。2. 排查报错请用干货模式分析这个报错:【粘贴报错】理想输出:
最可能原因:1. 依赖缺失2. 版本不兼容3. 环境变量没配先查:npm -vnode -vcat .env.example3. 检查文件改动风险请用干货模式检查这次改动的风险。输出:高风险、中风险、低风险、建议验证命令。4. 做提交说明请用干货模式生成 commit message。只要 1 行标题 + 3 条要点。5. 整理安装步骤请用干货模式整理这个工具的安装步骤。要求:环境、命令、成功标志、常见坑。这些任务不需要散文式表达。
越短越好。
七、什么时候别用?
有些场景不适合压得太狠。
比如:
给刚上手的朋友解释概念;
写对外说明;
写客户邮件;
做完整教程;
整理复杂安全风险;
需要保留上下文和推理过程的任务。
这种时候可以临时切回正常模式:
normal mode或者直接说:
这次请详细解释,适合新手阅读。干货模式是工具,不是枷锁。
想短就短,想细就细。
八、还能压缩长期规则文件
Caveman 里还有一个很有意思的功能:caveman-compress。
它可以把类似 CLAUDE.md 这种长期规则文件压短,并保留备份。项目说明里提到,它会保留代码、URL、路径等内容,目标是减少每次会话启动时都要读入的规则文本。
这对 Hermes 用户有启发。
如果你有很长的项目规则、助手个性、工具说明,也可以做类似事情:
把啰嗦规则压成短规则;
命令、路径、文件名保持原样;
安全边界不能删;
压缩后人工检查一遍。
比如原来写:
在修改任何环境变量文件之前,你都需要先向用户说明风险,并等待用户确认。可以压成:
改 .env 前先说明风险,等确认。意思没变,字少很多。
但别把关键安全规则压没。
比如“不要删除文件”“不要提交真实数据”“高风险命令先确认”,这些必须保留。
九、可选:想长期默认精炼,可以加一段项目规则
如果你只是临时想让 Hermes 精炼一点,直接用:
/caveman lite就够了。
但有些项目你可能会长期维护,比如本地工具、自动化脚本、内部后台、小程序项目。每次打开都想让 Hermes 少客套、少铺垫、先给结论,那可以在项目规则里再加一段固定要求。
可以复制这一段:
## 输出风格技术任务默认精炼输出:- 先给结论,不写寒暄- 命令、路径、文件名保持完整- 原因只写必要信息- 风险单独列出- 不确定就写“不确定”- 不重复解释同一件事- 能用表格就用表格- 最后给下一步动作优先使用这个结构:结论:操作:风险:下一步:排错类任务可以再加:
## 排错规则- 先给最可能原因- 再给验证命令- 执行高风险命令前先问我- 不要扩写无关背景- 每一步都要说明结果这样做的好处是,Caveman 负责临时压缩回答,项目规则负责长期固定风格。
最稳的用法是:
临时精简:/caveman lite更短结果:/caveman full项目长期默认:写进项目规则需要详细解释:normal mode刚开始建议先用 /caveman lite,看几轮输出效果。确定你喜欢这种风格后,再把规则写进项目里。
最后说一句
Caveman 这个项目好玩,但它真正有用的地方很朴素:
AI 不用每次都写小作文。
Hermes 这类 Agent 工具越常用,越需要控制输出风格。查资料、看文件、排错、解释命令、总结日志,很多场景只要结论和下一步。
如果你正在走低成本 Agent 路线,比如 Hermes 接 DeepSeek V4、主模型用 Pro、杂活交给 Flash,那“少废话模式”很适合作为第三块拼图:
便宜模型:降低单价辅模型分工:减少浪费干货模式:压短输出先别急着上 Ultra。
从 Lite 开始。
让 Hermes 少客套、少铺垫、少重复,保留命令、风险和下一步。
一句话总结:
让 AI 少说漂亮话,多给可执行结果。
热门跟贴