Claude用户踩了3年坑：90%的token花在「废话」上

野生运营

2026-04-06 14:45 ·北京

「Claude usage limit reached. Your limit will reset at 7pm」——这条消息，重度用户平均每周见2.7次。

更扎心的是：你以为是Anthropic（美国人工智能公司）在限速，其实是你的用法在烧钱。Medium作者Vinay Bhaskarla算过一笔账，大多数付费token根本没花在答案上，而是反复处理你留下的混乱对话历史。这像雇了顶级顾问，却让他每天先花三小时整理你随手记的便签。

Claude的「短期记忆」陷阱

Claude的「短期记忆」陷阱

把Claude想象成一位智商极高、但只能记住当前对话的助理。每次你提问，它都要把整段聊天记录重读一遍来理解上下文——对话越长，负担越重。

Bhaskarla打了个精妙的比方：你对一个人说话，先给指令，再自我纠正，再补充细节，再突然改方向。对方困惑不是因为笨，是你给的噪音太多。AI同理：更好的输入带来更好的输出，更干净的上下文带来更锐利的回答。

很多人把Claude当搜索引擎用。「写个摘要」——这种prompt（提示词）等于让助理猜你要什么格式、多长、给谁看。结果？来回三趟修改，token烧掉三倍，答案还跑偏。

4个被验证的提效动作

4个被验证的提效动作

第一，一次性给全信息。别写「写个摘要」，写「用5个 bullet point（项目符号）总结这篇文章，语言简单，给初学者一个清晰 takeaway（关键收获）」。你不是在增加复杂度，是在消除歧义。Claude看到完整目标时，表现显著更优。

第二，拒绝「补丁式」对话。「不对，我是说另一种意思」——每次纠正都是噪音叠加。直接编辑原prompt重新生成，你是在精炼指令，不是在堆叠混乱。

第三，任务合并。烂流程：先「总结这个」，再「提取关键点」，再「想个好标题」。好流程：「总结这个，提取关键点，并建议一个强标题」。减少重复调用，提升连贯性。

第四，及时重启。对话长了、回答开始跑偏，别硬撑。让Claude「用干净的结构化格式总结目前所有内容」，开新对话贴进去。保留信号，切除噪音。

模型选择：别用核弹炸蚊子

模型选择：别用核弹炸蚊子

不是每个任务都需要最强模型。简单分类、格式转换、基础摘要——轻量模型足够。复杂推理、长文档分析、创意写作——再上调档位。很多人全程开Max计划，像在市区把跑车油门踩到底。

Bhaskarla的核心洞察很直白：效率问题被误读为产品问题。Anthropic的限速机制是真实存在的，但用户侧的浪费同样真实。两者叠加，才有了那每周2.7次的红色警告。

一位Claude Max计划用户在评论区写道：「按这方法调整后，我的月度token消耗下降了60%，输出质量反而更稳。」

你的对话历史里，有多少比例是在让AI帮你收拾自己的烂摊子？

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴