你有没有发现,现在很多 AI 工具越来越能干,但也越来越“会说”。

你只是问一句:

这个报错怎么处理?

它能先来一段:

“这个问题通常可能由多种原因导致,我们可以一步步排查……”

再列背景、再讲原理、再铺垫注意事项,最后才告诉你真正该敲哪条命令。

有时候这很贴心。

但更多时候,你只是想要:

原因是什么?命令是什么?风险是什么?下一步做什么?

尤其在 Hermes 这种 Agent 工具里,AI 经常要读文件、跑命令、查资料、回报结果。它每多说一堆客套话,就多烧一截输出 token。

今天这个项目叫 Caveman,名字很搞笑,思路很实用:让 Agent 少说废话,用更短的话表达同样的技术信息。

GitHub 上 JuliusBrussee/caveman 当前已经有 56k+ Star。项目介绍里说,它是给 Claude Code、Codex、Gemini CLI、Cursor、Windsurf、Cline、Copilot 等 Agent 用的 Skill / 插件,可以让回答变短,项目 benchmark 里平均减少约 65% 输出 token,范围大概在 22% 到 87%。这里要注意,它主要压缩的是看得见的输出内容,不是让模型少思考。

放到 Hermes 上,这个思路特别值得借鉴。

哪怕你不直接装插件,也可以把它的“干货模式”规则写进 Hermes 的项目规则或助手个性里,让 Hermes 回答更短、更直接、更省 token。

打开网易新闻 查看精彩图片

一、Caveman 到底做了什么?

它干的事并不复杂。

普通 AI 回答可能是:

这个问题很可能是由于你的认证中间件没有正确校验 token 过期时间导致的。你可以检查一下 token expiry 的判断条件……

Caveman 风格会压成:

认证中间件问题。token 过期判断错。检查 < 和 <=。

信息还在,包装没了。

项目 README 里给过类似例子:一段 React 组件重渲染解释,正常写法 69 tokens,压缩后 19 tokens,核心意思仍然保留。它也提供 Lite、Full、Ultra、文言文几种强度,Lite 保留正常语法,只删废话;Full 更短;Ultra 接近电报风;文言文模式则更偏趣味玩法。

这很适合技术场景。

比如:

解释命令;
排查报错;
检查依赖冲突;
总结日志;
列出改动风险;
给出下一步操作;
做代码审查;
生成提交说明。

这些场景最怕一大段漂亮话。

你需要的是结论快、命令准、风险清楚。

二、它省的是什么 token?

这里要讲清楚,别把它神化。

Caveman 主要省的是 输出 token

也就是 AI 最后吐出来给你看的文字。

它不会减少模型内部的推理消耗,也不会让模型“少动脑”。项目作者在相关讨论里也强调过,它针对的是可见回答里的铺垫、寒暄、修饰和重复解释。

所以它最适合解决这类问题:

回答太长;
总结太啰嗦;
每次都先客套;
同一个风险反复说;
命令前后包一堆解释;
审查意见写成小作文。

它不适合拿来压缩所有任务。

如果你让 AI 学一个全新概念,或者让它给刚上手的朋友写详细教程,回答太短反而会影响理解。

我的建议很简单:

日常技术协作:Lite熟悉项目以后:Full只要自己看结果:Ultra写教程、写说明、给别人看:慎用
三、Hermes 怎么用?直接装这个 Skill

既然是 Skill,那最舒服的方式就是直接装进 Hermes。

先在终端里搜一下:

hermes skills search caveman

看到结果后,先别急着装,先看详情:

hermes skills inspect caveman

确认来源、说明和安装命令没问题,再安装:

hermes skills install caveman

如果你在 Skill Hub 页面里看到的卡片命令是带路径的,比如类似:

hermes skills install <某个来源>/caveman

那就以卡片底部显示的命令为准。Skill 市场里的命令最稳,不要自己乱猜名字。

装完以后,可以检查一下:

hermes skills list

看到 caveman 出现在列表里,就说明装好了。

接下来进入 Hermes:

hermes chat

在会话里可以这样开启:

/caveman

如果你只想轻微精简,建议先用 Lite:

/caveman lite

这是最适合日常使用的一档。它会删掉客套话和绕圈表达,但句子仍然比较正常,读起来不费劲。

如果你已经很熟悉当前任务,只想要更短的技术结论,可以用:

/caveman full

如果你只想自己快速看结果,不在乎语气和完整表达,可以试:

/caveman ultra

不过我不建议一上来就 Ultra。它会压得很狠,适合熟悉项目的人自己看,不太适合拿去给别人看。

想恢复正常输出,可以输入:

normal mode

或者:

stop caveman

最推荐的新手顺序是:

/caveman lite

先用几轮,看看回答是不是更短、更清楚。如果觉得还啰嗦,再切到:

/caveman full

别一开始就把输出压到最极限。省 token 是好事,但看不懂就得不偿失。

四、装完以后怎么用才最舒服?

Caveman 最适合搭配这种任务:

解释命令;
排查报错;
总结日志;
检查文件改动;
生成提交说明;
整理安装步骤;
列出风险和下一步。

比如你可以这样问:

/caveman lite请解释这个命令的作用,不要执行:npm install

理想输出应该更像这样:

作用:安装 package.json 里的依赖。会改:node_modules,可能改 lock 文件。风险:版本变化可能导致启动异常。下一步:装完跑 npm run dev 或 npm test。

排查报错时可以这样写:

/caveman lite请分析这个报错。输出格式:结论:可能原因:验证命令:风险:下一步:

检查改动风险时可以这样写:

/caveman full请检查这次文件改动的风险。只输出:1. 高风险2. 中风险3. 低风险4. 建议验证命令

整理安装步骤时可以这样写:

/caveman lite请整理这个工具的安装流程。只保留:环境要求安装命令最小测试成功标志常见坑

这个 Skill 的价值就在这里。

以前 Hermes 回答像“技术说明书”,现在更像“排查工单”:

结论是什么命令是什么风险是什么下一步是什么

对经常让 Hermes 查资料、看文件、排错、跑命令的用户来说,这种输出更顺手,也更省输出 token。

五、不建议什么时候开?

别把 Caveman 当成万能默认模式。

这些场景不建议压得太狠:

给新手讲概念;
写完整教程;
写对外说明;
写客户邮件;
解释复杂原理;
做安全风险分析;
需要完整上下文的任务。

遇到这类任务,可以先切回正常模式:

normal mode

或者直接说:

这次请详细解释,适合新手阅读。

我的建议是:

日常技术协作:/caveman lite熟悉项目排错:/caveman full只给自己看结果:/caveman ultra需要详细教学:normal mode

这样用最舒服。

六、哪些场景最适合? 1. 解释命令

请用干货模式解释这个命令:npm install

理想输出:

作用:安装 package.json 里的依赖。会改:node_modules,可能改 lock 文件。风险:版本变化可能导致启动异常。下一步:装完跑 npm run dev 或 npm test。
2. 排查报错

请用干货模式分析这个报错:【粘贴报错】

理想输出:

最可能原因:1. 依赖缺失2. 版本不兼容3. 环境变量没配先查:npm -vnode -vcat .env.example
3. 检查文件改动风险

请用干货模式检查这次改动的风险。输出:高风险、中风险、低风险、建议验证命令。
4. 做提交说明

请用干货模式生成 commit message。只要 1 行标题 + 3 条要点。
5. 整理安装步骤

请用干货模式整理这个工具的安装步骤。要求:环境、命令、成功标志、常见坑。

这些任务不需要散文式表达。

越短越好。

七、什么时候别用?

有些场景不适合压得太狠。

比如:

给刚上手的朋友解释概念;
写对外说明;
写客户邮件;
做完整教程;
整理复杂安全风险;
需要保留上下文和推理过程的任务。

这种时候可以临时切回正常模式:

normal mode

或者直接说:

这次请详细解释,适合新手阅读。

干货模式是工具,不是枷锁。

想短就短,想细就细。

八、还能压缩长期规则文件

Caveman 里还有一个很有意思的功能:caveman-compress。

它可以把类似 CLAUDE.md 这种长期规则文件压短,并保留备份。项目说明里提到,它会保留代码、URL、路径等内容,目标是减少每次会话启动时都要读入的规则文本。

这对 Hermes 用户有启发。

如果你有很长的项目规则、助手个性、工具说明,也可以做类似事情:

把啰嗦规则压成短规则;
命令、路径、文件名保持原样;
安全边界不能删;
压缩后人工检查一遍。

比如原来写:

在修改任何环境变量文件之前,你都需要先向用户说明风险,并等待用户确认。

可以压成:

改 .env 前先说明风险,等确认。

意思没变,字少很多。

但别把关键安全规则压没。

比如“不要删除文件”“不要提交真实数据”“高风险命令先确认”,这些必须保留。

九、可选:想长期默认精炼,可以加一段项目规则

如果你只是临时想让 Hermes 精炼一点,直接用:

/caveman lite

就够了。

但有些项目你可能会长期维护,比如本地工具、自动化脚本、内部后台、小程序项目。每次打开都想让 Hermes 少客套、少铺垫、先给结论,那可以在项目规则里再加一段固定要求。

可以复制这一段:

## 输出风格技术任务默认精炼输出:- 先给结论,不写寒暄- 命令、路径、文件名保持完整- 原因只写必要信息- 风险单独列出- 不确定就写“不确定”- 不重复解释同一件事- 能用表格就用表格- 最后给下一步动作优先使用这个结构:结论:操作:风险:下一步:

排错类任务可以再加:

## 排错规则- 先给最可能原因- 再给验证命令- 执行高风险命令前先问我- 不要扩写无关背景- 每一步都要说明结果

这样做的好处是,Caveman 负责临时压缩回答,项目规则负责长期固定风格。

最稳的用法是:

临时精简:/caveman lite更短结果:/caveman full项目长期默认:写进项目规则需要详细解释:normal mode

刚开始建议先用 /caveman lite,看几轮输出效果。确定你喜欢这种风格后,再把规则写进项目里。

最后说一句

Caveman 这个项目好玩,但它真正有用的地方很朴素:

AI 不用每次都写小作文。

Hermes 这类 Agent 工具越常用,越需要控制输出风格。查资料、看文件、排错、解释命令、总结日志,很多场景只要结论和下一步。

如果你正在走低成本 Agent 路线,比如 Hermes 接 DeepSeek V4、主模型用 Pro、杂活交给 Flash,那“少废话模式”很适合作为第三块拼图:

便宜模型:降低单价辅模型分工:减少浪费干货模式:压短输出

先别急着上 Ultra。

从 Lite 开始。

让 Hermes 少客套、少铺垫、少重复,保留命令、风险和下一步。

一句话总结:

让 AI 少说漂亮话,多给可执行结果。

打开网易新闻 查看精彩图片