2026年,AI工具最让人烦心的,不是免费版不够用了必须掏钱。这事儿大家已经无奈接受了。真正恼火的是,你花钱订的服务也开始给你限额。每周有额度,滚动窗口倒计时,正干着活呢突然弹出来一句"您已达用量上限,请稍后再试"。你在这上面的花费比任何其他服务都高,却得盯着流量表、精打细算地抠着用。

所以我干了件该干的事:去翻那个流量表。我用了一款命令行工具,它能把Claude Code的本地日志转成消费报告。还装了个叫claude-memory的插件,是gupsammy/claudest应用市场里的,能通过/get-token-insights指令把你的用量一轮一轮拆开,在浏览器里生成可视化面板。我进去的时候并不清楚自己想看到什么,但绝没想到报告把矛头指向了我养成的坏习惯。

打开网易新闻 查看精彩图片

我发出的每一条消息里,有三分之一是在重复我自己。要理解这个问题,得先了解这套工具怎么运作。你每次在Claude Code里发一条消息,它会把运行需要的全部内容,连同你刚问的问题,重新发送一遍。这包括告诉它该如何行事的系统指令、每一个它有权调用的工具的描述、配置文件里你写下的自定义规则,以及你开启的每一个附加组件。这些东西打包在一起,每一轮对话都重新发一次,因为模型在两次消息之间没有记忆。它记不住你上一句话说了什么,于是每次你敲回车,整套规则书都得重头再来一遍。仪表盘显示,我发送给Claude Code的全部内容里,有33.7%只是这个固定载荷——不断重复地对会话做自我介绍。

那它怎么变这么臃肿的?全是我自己造成的。因为我从来没好好收拾过。几个月前写的自定义指令,一路往上加,从没删减过。我还接入了一堆工具、创建了一些技能,往往只为一个任务启用一次,之后就彻底忘了。每一项都会悄悄把自己的描述塞进前面说的那套规则书,而我不管当时用不用得着,都把它们拖着跑进每一次请求里。这个固定载荷在短时间内还算便宜,只要工具还记得它,缓存就能带来重复内容的折扣。但短期记忆一旦到期,整坨臃肿的载荷就得全额重新传输。我后面会谈到,这个记忆过期的速度比你想象得快得多,所以我让载荷变得越大,浪费就越惊人。