为什么你的AI助手每次对话都像失忆?问题可能不是"记多少",而是"怎么记"。

1. 我们搞错了方向

打开网易新闻 查看精彩图片

行业疯狂卷上下文长度,从4K token飙到百万级。但作者直言:这像给金鱼换更大的鱼缸——游得再远,还是金鱼。

打开网易新闻 查看精彩图片

核心矛盾在于:连续性(continuity)记忆容量(memory)。前者是"记得我们聊到哪儿",后者只是"能塞多少字"。

2. 现在的RAG像碎纸机拼贴

检索增强生成(RAG)把知识切成碎片,用时再捞。作者吐槽:这相当于每次见面递给对方一叠便签,"你自己翻吧"。

人类对话的流畅感,来自层层递进的语境堆叠。而多数AI系统在"会话边界"处硬重启,用户被迫重复背景。

3. 真正的连续性长什么样

作者提了三个未被满足的需求:

跨会话身份:AI该记得你讨厌被叫"亲",偏好深夜回复

渐进式理解:不是一次性喂饱,而是像同事那样"越配合拍"

打开网易新闻 查看精彩图片

主动维护关系:定期回访、跟进旧话题,而非被动等指令

4. 技术债卡在哪儿

当前架构的瓶颈很现实:状态管理成本高,多租户隔离复杂,隐私合规更难做。但作者认为,这些是"不想做"的借口,不是"不能做"。

产品层面已有信号。部分企业开始测试"长期用户画像"功能,用轻量级摘要替代全量历史存储——算力换智能的妥协方案。

5. 谁先破局谁吃肉

连续性体验一旦跑通,用户迁移成本将指数级上升。毕竟,重新教一个新AI"我是谁",比学新软件更烦。

作者最后补刀:现在的大厂竞赛,像在马拉松起点比谁鞋带系得紧。