我查了Claude Code的用量日志，发现问题出在我自己身上|claude|code|插件|载荷

2026年，AI工具最让人烦心的，不是免费版不够用了必须掏钱。这事儿大家已经无奈接受了。真正恼火的是，你花钱订的服务也开始给你限额。每周有额度，滚动窗口倒计时，正干着活呢突然弹出来一句"您已达用量上限，请稍后再试"。你在这上面的花费比任何其他服务都高，却得盯着流量表、精打细算地抠着用。

所以我干了件该干的事：去翻那个流量表。我用了一款命令行工具，它能把Claude Code的本地日志转成消费报告。还装了个叫claude-memory的插件，是gupsammy/claudest应用市场里的，能通过/get-token-insights指令把你的用量一轮一轮拆开，在浏览器里生成可视化面板。我进去的时候并不清楚自己想看到什么，但绝没想到报告把矛头指向了我养成的坏习惯。

我发出的每一条消息里，有三分之一是在重复我自己。要理解这个问题，得先了解这套工具怎么运作。你每次在Claude Code里发一条消息，它会把运行需要的全部内容，连同你刚问的问题，重新发送一遍。这包括告诉它该如何行事的系统指令、每一个它有权调用的工具的描述、配置文件里你写下的自定义规则，以及你开启的每一个附加组件。这些东西打包在一起，每一轮对话都重新发一次，因为模型在两次消息之间没有记忆。它记不住你上一句话说了什么，于是每次你敲回车，整套规则书都得重头再来一遍。仪表盘显示，我发送给Claude Code的全部内容里，有33.7%只是这个固定载荷——不断重复地对会话做自我介绍。

那它怎么变这么臃肿的？全是我自己造成的。因为我从来没好好收拾过。几个月前写的自定义指令，一路往上加，从没删减过。我还接入了一堆工具、创建了一些技能，往往只为一个任务启用一次，之后就彻底忘了。每一项都会悄悄把自己的描述塞进前面说的那套规则书，而我不管当时用不用得着，都把它们拖着跑进每一次请求里。这个固定载荷在短时间内还算便宜，只要工具还记得它，缓存就能带来重复内容的折扣。但短期记忆一旦到期，整坨臃肿的载荷就得全额重新传输。我后面会谈到，这个记忆过期的速度比你想象得快得多，所以我让载荷变得越大，浪费就越惊人。