AI范儿 · 今日速评

这一周的 AI 圈,剧情密度拉满了。

上周二(3月31日),Claude Code 51 万行源码意外泄漏。周六(4月4日),Anthropic 正式封杀小龙虾的订阅接入。

今天,小龙虾放出了 2026.4.5 版本,社区公认今年至今最大的一次更新。

记忆管理混乱和 token 消耗太高,一直是社区里被吐槽最多的两个问题。特别是后面一个也是 Claude 封杀小龙虾的核心原因之一。

这次更新,小龙虾终于下定决心从这两个痛点直接下手。

打开网易新闻 查看精彩图片

官方推文最后甩了一句话,三个短句,没有抱怨、没有控诉、没有回头看,只有一个态度:往前走。

Anthropic cut us off. GPT-5.4 got better. We moved on.

Anthropic 把我们切了。GPT-5.4 变强了。我们往前走了。

01小龙虾学会"做梦"了。

听起来很玄,但这可能是小龙虾迄今为止最重要的一次进化。

先说说原来的记忆是怎么回事。

养过小龙虾的人大概都体验过这种痛苦:一觉醒来,小龙虾突然失忆了。或者是,聊得好好的,过一会发现连前面的也不记得了。

聊得越久,它越像"注意力涣散",前面确认过的事后面又绕回来。

很多人以为是模型不够聪明。

其实不是,是记忆机制的问题。

小龙虾的记忆其实分三层:

小龙虾的三层记忆结构 不可靠 最持久 工作记忆 当前会话历史 维持本轮对话连续性,上下文窗口满了就压缩 默认每天凌晨4点重置 · 可配置空闲超时重置 · 可手动 /new 短期记忆 memory/YYYY-MM-DD.md 当天的"流水账",今天+昨天自动加载,更早靠搜索召回 压缩前自动刷写 · 新会话自动提取 · Agent 随时写入 长期记忆 MEMORY.md 精炼后的持久信息:偏好、决策、项目状态、关键事实 仅私聊自动加载 · 每次启动都消耗上下文预算

第一层是工作记忆,就是当前这轮对话的历史,保证它在同一段对话里能接着前文走。

但上下文窗口一满就会被压缩,压缩之后细节可能丢失。而且会话默认每天凌晨4点自动重置,也可以手动输入 /new 开新会话,或者配置空闲超时重置。

所以这层最不可靠,适合维持当前任务,不适合承担长期保存。(这也是很多人发现一觉醒来小龙虾失忆了的根本原因)

第二层是短期记忆,就是 memory/ 目录下的每日笔记,相当于当天的"流水账"。

它有三个写入来源:对话压缩前系统自动刷写、新会话开启时自动提取上一轮关键内容、Agent 自己随时往里写。

每次开启对话,今天和昨天的笔记自动加载,更早的靠语义搜索召回。

第三层是长期记忆,也就是 MEMORY.md。存的是精炼过的持久信息:你的偏好、项目约定、重要决策。

每次私聊自动加载。它不是流水账,而是经过筛选的长期知识。

这套系统看着挺完整,但实际用起来远没有你想的那么智能。

你以为它会自动把重要的东西记进 MEMORY.md?结果发现啥也没记。

你以为记了就万事大吉?结果三个月前说的"每周三开周会"和后来改的"每周四"同时存在,它也不知道该信哪个。

更麻烦的是,就算都记录了,内容越堆越多,互相冲突、过时信息没人清理。MEMORY.md 一旦膨胀,每个会话启动都要消耗大量上下文预算,反而拖累整体响应质量。

记得越多,反应越慢,回答越差。

到后来很多人(包括我)都放弃了自动记忆,改成手动维护 MEMORY.md,或者干脆把重要的东西写进 Skills 里。

本来应该是 AI 帮你记,结果变成了你帮 AI 记。

这次 v2026.4.5 更新里最重磅的功能,就是来解决这个问题的:Dreaming。它补上的是记忆系统最后一环:自动从流水账里提炼精华,自动清理过期和矛盾的内容。

Dreaming 工作原理 每日笔记 memory/ 流水账、冗余、矛盾 越积越多 Dreaming 整理 light 扫描 → REM 关联 → deep 决策 六维度打分 · 全部达标才提拔 清矛盾 · 转日期 · 删过期 MEMORY.md 精炼后的长期记忆 干净、准确、不臃肿 DREAMS.md 梦境日记

原理跟人的睡眠记忆机制很像:白天经历了一大堆事,晚上大脑自动筛选,重要的固化成长期记忆,不重要的丢掉。小龙虾现在也会"睡觉"了。

它在后台综合六个维度打分:频率、相关度、话题多样性、时间新鲜度、跨天重复度、概念丰富度。全部达标的才会被"提拔"到 MEMORY.md 里,不达标的自然淘汰。

矛盾的信息会被清理,"昨天"这种相对日期会被转换成具体日期,已经删掉的文件引用会被移除。

默认每天凌晨3点自动运行一次整理。内部分三个阶段依次执行:先做轻度扫描(light),再做回顾和关联(REM),最后由 deep 阶段决定哪些信息值得写入 MEMORY.md。

Light 轻度扫描筛选 REM 回顾关联整理 Deep 写入 MEMORY.md

只有 deep 阶段才会真正修改你的长期记忆,前两个阶段只是筛选和准备。

这三个阶段的命名借鉴了人类睡眠科学:Light 是浅睡期,大脑初步整理白天的信息;REM 是快速眼动期,也就是做梦的阶段,大脑在回顾和建立关联;Deep 是深度睡眠期,真正把重要记忆固化下来。小龙虾的记忆整理,走的是同样的路径。

整理完还会生成一份 DREAMS.md,相当于"梦境日记",你可以看到它整理了什么。

以前 Dreaming 之后 → 只写不清理 自动整理提炼 矛盾信息共存 冲突自动清理 越记越臃肿 定期瘦身淘汰 手动维护 MEMORY.md 后台自动运行 吞噬上下文预算 保持精简高效

其实这个思路,Claude Code 在3月下旬就做了:Auto Memory 负责记笔记,Auto Dream 负责整理笔记。

小龙虾这次的 Dreaming 是同一方向的开源实现,但做了自己的设计:六维度加权打分、分阶段整理、梦境日记可视化。

而上周 Claude Code 51万行源码意外泄漏,让开源社区看到了 Auto Dream 完整的内部实现。

源码泄漏6天后这个功能就上线了,时间线确实很紧凑。

想试试的话,在小龙虾对话里输入 /dreaming on 就能打开,用 /dreaming status 查看当前状态。默认关闭。

另外, Dashboard里面也专门更新了一个“梦境”页面。

打开网易新闻 查看精彩图片

02被嫌太费钱?那就学会省钱。

除了记忆混乱,小龙虾被吐槽最多的另一个问题就是太费 token

每次跟大模型对话,小龙虾都会把系统提示、工具清单、历史上下文一股脑全发过去。

哪怕这些内容跟上一轮完全一样,也要重新发送、重新处理。工具清单还存在重复,排序每次都不一样,导致缓存反复失效。

翻译成人话:每次去医院都要把身份证号、家庭住址、过往病史重新念一遍,哪怕你上周刚来过。

这也是 Anthropic 封杀小龙虾的核心原因之一。Claude Code 的负责人 Boris Cherny 在宣布封杀时说得很直白:"我们的订阅本来就不是按第三方工具的用量模式设计的,第三方工具没有做缓存优化,我们很难可持续地支撑下去。"

但紧接着他又做了一件让人意外的事:他自己提交了几个 PR,专门帮小龙虾改善 Claude 的缓存命中率。

打开网易新闻 查看精彩图片

小米大模型负责人 Fuli Luo 前两天在 X 上也分析过:小龙虾的调用方式确实太浪费 token,一个用户的查询实际产生的请求数量可能是 Claude Code 自家框架的好几倍。

打开网易新闻 查看精彩图片

但她也说,被封杀的压力反而会倒逼这些工具优化上下文管理、减少无效消耗。

这话刚刚说完,小龙虾就交出了答卷。

这次更新大幅优化了 Prompt Caching:没变的系统指令和上下文可以跨轮次复用,不用每次都重新处理。

去掉了重复的工具清单,MCP 工具排序做了确定性处理,避免顺序变化导致缓存失效。还支持心跳保活,防止缓存过期后又要重新写入。

现在医院把你的档案存起来了,直接说"我是上次那个"就行。不用每次都从头念一遍。

对养虾党来说这是实实在在的好消息。不管你用 API 按量付费还是 OpenRouter,缓存优化意味着同样的任务,以后烧的钱更少了。

03不只是做梦和省钱

这次更新远不止这两个功能。照着官方推文列一下:

v2026.4.5 其他重要更新 内置视频 + 音乐生成 Runway · 通义万相 · xAI Google Lyria · MiniMax 开箱即用,一句话生成 GPT-5.4 深度适配 原生支持 + 个性化配置 Claude 之后的新主力模型 结构化任务进度 复杂任务每步可视化 不用对着屏幕盲等了 控制面板 +12 种语言 简体中文 · 繁体中文 等 新手入门门槛更低

内置视频和音乐生成。上周我刚写了怎么在小龙虾里接入即梦和 LibTV 来用 Seedance 2.0 生成视频,当时还要手动配置。这不,官方直接来了个内置集成,开箱就能用。

视频支持 Runway、阿里通义万相、xAI 等,音乐支持 Google Lyria 和 MiniMax。

结构化任务进度。以前让小龙虾执行复杂任务,你只能对着屏幕盲等,不知道它进行到哪一步了。现在每一步的进度、状态都能看到。

控制面板支持12种新语言。包括简体中文和繁体中文,新手入门的门槛又低了一截。

GPT-5.4 深度适配。加入了 GPT-5.4 的原生支持和个性化配置。结合官方那句"GPT-5.4 got better. We moved on.",方向很明确:被 Claude 赶走之后,GPT-5.4 成了新的主力模型。

04你封杀我,我进化给你看。

回头看这一周的时间线:

3月31日 Claude Code 源码泄漏 51万行代码、Auto Dream 实现细节全部公开 4月4日 Anthropic 正式封杀小龙虾 订阅额度不再覆盖第三方工具 4月6日 小龙虾发布今年最大更新 Dreaming + 缓存优化 + 视频音乐 + GPT-5.4 适配

而且这次更新里,小龙虾主动把 Claude 的订阅接入方式从新用户引导流程中移除了。

官方也承认了这条路走不通了,直接引导用户去用 API 或者其他模型。

态度很明确:你不让我蹭,那我就不蹭了。但我不会因此变弱,只会变强。

这个版本共有103位贡献者参与。这就是开源社区的力量:一家公司可以封杀你的接入,但封不住103个人同时给你写代码。

打开网易新闻 查看精彩图片

上周我在文章里说过:小龙虾还是那只小龙虾,换个"饲料"就好了。现在看,它不只换了饲料,还顺便进化了。

在 AI 这个行业里,封杀从来不是终点,而是进化的起点。

所以下次再看到什么"封杀""禁止""限制"的新闻,别急着恐慌。开源世界的回应速度,永远比你想象的快。

你的小龙虾更新了吗?最期待哪个新功能?评论区聊聊你的体验觉得有用 → 点个❤️在看转给还不知道的朋友点个赞 告诉我你看完了关注「AI范儿」,下次更新第一时间收到