大模型的记忆难题，解法不在硬件？

摸鱼算法

2026-04-30 06:09 ·北京

为什么你的AI助手每次对话都像失忆？问题可能不是"记多少"，而是"怎么记"。

1. 我们搞错了方向

行业疯狂卷上下文长度，从4K token飙到百万级。但作者直言：这像给金鱼换更大的鱼缸——游得再远，还是金鱼。

核心矛盾在于：连续性（continuity）≠记忆容量（memory）。前者是"记得我们聊到哪儿"，后者只是"能塞多少字"。

2. 现在的RAG像碎纸机拼贴

检索增强生成（RAG）把知识切成碎片，用时再捞。作者吐槽：这相当于每次见面递给对方一叠便签，"你自己翻吧"。

人类对话的流畅感，来自层层递进的语境堆叠。而多数AI系统在"会话边界"处硬重启，用户被迫重复背景。

3. 真正的连续性长什么样

作者提了三个未被满足的需求：

• 跨会话身份：AI该记得你讨厌被叫"亲"，偏好深夜回复

• 渐进式理解：不是一次性喂饱，而是像同事那样"越配合拍"

• 主动维护关系：定期回访、跟进旧话题，而非被动等指令

4. 技术债卡在哪儿

当前架构的瓶颈很现实：状态管理成本高，多租户隔离复杂，隐私合规更难做。但作者认为，这些是"不想做"的借口，不是"不能做"。

产品层面已有信号。部分企业开始测试"长期用户画像"功能，用轻量级摘要替代全量历史存储——算力换智能的妥协方案。

5. 谁先破局谁吃肉

连续性体验一旦跑通，用户迁移成本将指数级上升。毕竟，重新教一个新AI"我是谁"，比学新软件更烦。

作者最后补刀：现在的大厂竞赛，像在马拉松起点比谁鞋带系得紧。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴