刚被封杀两天，小龙虾就放出了今年最强大的更新！|一满|上下文|小龙虾|源码|翻译|调用

AI范儿 · 今日速评

这一周的 AI 圈，剧情密度拉满了。

上周二（3月31日），Claude Code 51 万行源码意外泄漏。周六（4月4日），Anthropic 正式封杀小龙虾的订阅接入。

今天，小龙虾放出了 2026.4.5 版本，社区公认今年至今最大的一次更新。

记忆管理混乱和 token 消耗太高，一直是社区里被吐槽最多的两个问题。特别是后面一个也是 Claude 封杀小龙虾的核心原因之一。

这次更新，小龙虾终于下定决心从这两个痛点直接下手。

官方推文最后甩了一句话，三个短句，没有抱怨、没有控诉、没有回头看，只有一个态度：往前走。

Anthropic cut us off. GPT-5.4 got better. We moved on.

Anthropic 把我们切了。GPT-5.4 变强了。我们往前走了。

01小龙虾学会"做梦"了。

听起来很玄，但这可能是小龙虾迄今为止最重要的一次进化。

先说说原来的记忆是怎么回事。

养过小龙虾的人大概都体验过这种痛苦：一觉醒来，小龙虾突然失忆了。或者是，聊得好好的，过一会发现连前面的也不记得了。

聊得越久，它越像"注意力涣散"，前面确认过的事后面又绕回来。

很多人以为是模型不够聪明。

其实不是，是记忆机制的问题。

小龙虾的记忆其实分三层：

小龙虾的三层记忆结构不可靠最持久工作记忆当前会话历史维持本轮对话连续性，上下文窗口满了就压缩默认每天凌晨4点重置 · 可配置空闲超时重置 · 可手动 /new 短期记忆 memory/YYYY-MM-DD.md 当天的"流水账"，今天+昨天自动加载，更早靠搜索召回压缩前自动刷写 · 新会话自动提取 · Agent 随时写入长期记忆 MEMORY.md 精炼后的持久信息：偏好、决策、项目状态、关键事实仅私聊自动加载 · 每次启动都消耗上下文预算

第一层是工作记忆，就是当前这轮对话的历史，保证它在同一段对话里能接着前文走。

但上下文窗口一满就会被压缩，压缩之后细节可能丢失。而且会话默认每天凌晨4点自动重置，也可以手动输入 /new 开新会话，或者配置空闲超时重置。

所以这层最不可靠，适合维持当前任务，不适合承担长期保存。（这也是很多人发现一觉醒来小龙虾失忆了的根本原因）

第二层是短期记忆，就是 memory/ 目录下的每日笔记，相当于当天的"流水账"。

它有三个写入来源：对话压缩前系统自动刷写、新会话开启时自动提取上一轮关键内容、Agent 自己随时往里写。

每次开启对话，今天和昨天的笔记自动加载，更早的靠语义搜索召回。

第三层是长期记忆，也就是 MEMORY.md。存的是精炼过的持久信息：你的偏好、项目约定、重要决策。

每次私聊自动加载。它不是流水账，而是经过筛选的长期知识。

这套系统看着挺完整，但实际用起来远没有你想的那么智能。

你以为它会自动把重要的东西记进 MEMORY.md？结果发现啥也没记。

你以为记了就万事大吉？结果三个月前说的"每周三开周会"和后来改的"每周四"同时存在，它也不知道该信哪个。

更麻烦的是，就算都记录了，内容越堆越多，互相冲突、过时信息没人清理。MEMORY.md 一旦膨胀，每个会话启动都要消耗大量上下文预算，反而拖累整体响应质量。

记得越多，反应越慢，回答越差。

到后来很多人（包括我）都放弃了自动记忆，改成手动维护 MEMORY.md，或者干脆把重要的东西写进 Skills 里。

本来应该是 AI 帮你记，结果变成了你帮 AI 记。

这次 v2026.4.5 更新里最重磅的功能，就是来解决这个问题的：Dreaming。它补上的是记忆系统最后一环：自动从流水账里提炼精华，自动清理过期和矛盾的内容。

Dreaming 工作原理每日笔记 memory/ 流水账、冗余、矛盾越积越多 Dreaming 整理 light 扫描 → REM 关联 → deep 决策六维度打分 · 全部达标才提拔清矛盾 · 转日期 · 删过期 MEMORY.md 精炼后的长期记忆干净、准确、不臃肿 DREAMS.md 梦境日记

原理跟人的睡眠记忆机制很像：白天经历了一大堆事，晚上大脑自动筛选，重要的固化成长期记忆，不重要的丢掉。小龙虾现在也会"睡觉"了。

它在后台综合六个维度打分：频率、相关度、话题多样性、时间新鲜度、跨天重复度、概念丰富度。全部达标的才会被"提拔"到 MEMORY.md 里，不达标的自然淘汰。

矛盾的信息会被清理，"昨天"这种相对日期会被转换成具体日期，已经删掉的文件引用会被移除。

默认每天凌晨3点自动运行一次整理。内部分三个阶段依次执行：先做轻度扫描（light），再做回顾和关联（REM），最后由 deep 阶段决定哪些信息值得写入 MEMORY.md。

Light 轻度扫描筛选 REM 回顾关联整理 Deep 写入 MEMORY.md

只有 deep 阶段才会真正修改你的长期记忆，前两个阶段只是筛选和准备。

这三个阶段的命名借鉴了人类睡眠科学：Light 是浅睡期，大脑初步整理白天的信息；REM 是快速眼动期，也就是做梦的阶段，大脑在回顾和建立关联；Deep 是深度睡眠期，真正把重要记忆固化下来。小龙虾的记忆整理，走的是同样的路径。

整理完还会生成一份 DREAMS.md，相当于"梦境日记"，你可以看到它整理了什么。

以前 Dreaming 之后 → 只写不清理自动整理提炼矛盾信息共存冲突自动清理越记越臃肿定期瘦身淘汰手动维护 MEMORY.md 后台自动运行吞噬上下文预算保持精简高效

其实这个思路，Claude Code 在3月下旬就做了：Auto Memory 负责记笔记，Auto Dream 负责整理笔记。

小龙虾这次的 Dreaming 是同一方向的开源实现，但做了自己的设计：六维度加权打分、分阶段整理、梦境日记可视化。

而上周 Claude Code 51万行源码意外泄漏，让开源社区看到了 Auto Dream 完整的内部实现。

源码泄漏6天后这个功能就上线了，时间线确实很紧凑。

想试试的话，在小龙虾对话里输入 /dreaming on 就能打开，用 /dreaming status 查看当前状态。默认关闭。

另外， Dashboard里面也专门更新了一个“梦境”页面。

02被嫌太费钱？那就学会省钱。

除了记忆混乱，小龙虾被吐槽最多的另一个问题就是太费 token。

每次跟大模型对话，小龙虾都会把系统提示、工具清单、历史上下文一股脑全发过去。

哪怕这些内容跟上一轮完全一样，也要重新发送、重新处理。工具清单还存在重复，排序每次都不一样，导致缓存反复失效。

翻译成人话：每次去医院都要把身份证号、家庭住址、过往病史重新念一遍，哪怕你上周刚来过。

这也是 Anthropic 封杀小龙虾的核心原因之一。Claude Code 的负责人 Boris Cherny 在宣布封杀时说得很直白："我们的订阅本来就不是按第三方工具的用量模式设计的，第三方工具没有做缓存优化，我们很难可持续地支撑下去。"

但紧接着他又做了一件让人意外的事：他自己提交了几个 PR，专门帮小龙虾改善 Claude 的缓存命中率。

小米大模型负责人 Fuli Luo 前两天在 X 上也分析过：小龙虾的调用方式确实太浪费 token，一个用户的查询实际产生的请求数量可能是 Claude Code 自家框架的好几倍。

但她也说，被封杀的压力反而会倒逼这些工具优化上下文管理、减少无效消耗。

这话刚刚说完，小龙虾就交出了答卷。

这次更新大幅优化了 Prompt Caching：没变的系统指令和上下文可以跨轮次复用，不用每次都重新处理。

去掉了重复的工具清单，MCP 工具排序做了确定性处理，避免顺序变化导致缓存失效。还支持心跳保活，防止缓存过期后又要重新写入。

现在医院把你的档案存起来了，直接说"我是上次那个"就行。不用每次都从头念一遍。

对养虾党来说这是实实在在的好消息。不管你用 API 按量付费还是 OpenRouter，缓存优化意味着同样的任务，以后烧的钱更少了。

03不只是做梦和省钱

这次更新远不止这两个功能。照着官方推文列一下：

v2026.4.5 其他重要更新内置视频 + 音乐生成 Runway · 通义万相 · xAI Google Lyria · MiniMax 开箱即用，一句话生成 GPT-5.4 深度适配原生支持 + 个性化配置 Claude 之后的新主力模型结构化任务进度复杂任务每步可视化不用对着屏幕盲等了控制面板 +12 种语言简体中文 · 繁体中文等新手入门门槛更低

内置视频和音乐生成。上周我刚写了怎么在小龙虾里接入即梦和 LibTV 来用 Seedance 2.0 生成视频，当时还要手动配置。这不，官方直接来了个内置集成，开箱就能用。

视频支持 Runway、阿里通义万相、xAI 等，音乐支持 Google Lyria 和 MiniMax。

结构化任务进度。以前让小龙虾执行复杂任务，你只能对着屏幕盲等，不知道它进行到哪一步了。现在每一步的进度、状态都能看到。

控制面板支持12种新语言。包括简体中文和繁体中文，新手入门的门槛又低了一截。

GPT-5.4 深度适配。加入了 GPT-5.4 的原生支持和个性化配置。结合官方那句"GPT-5.4 got better. We moved on."，方向很明确：被 Claude 赶走之后，GPT-5.4 成了新的主力模型。

04你封杀我，我进化给你看。

回头看这一周的时间线：

3月31日 Claude Code 源码泄漏 51万行代码、Auto Dream 实现细节全部公开 4月4日 Anthropic 正式封杀小龙虾订阅额度不再覆盖第三方工具 4月6日小龙虾发布今年最大更新 Dreaming + 缓存优化 + 视频音乐 + GPT-5.4 适配

而且这次更新里，小龙虾主动把 Claude 的订阅接入方式从新用户引导流程中移除了。

官方也承认了这条路走不通了，直接引导用户去用 API 或者其他模型。

态度很明确：你不让我蹭，那我就不蹭了。但我不会因此变弱，只会变强。

这个版本共有103位贡献者参与。这就是开源社区的力量：一家公司可以封杀你的接入，但封不住103个人同时给你写代码。