一个好莱坞演员,这周在AI圈干了件大事。
电影《生化危机》女主角Alice,《第五元素》里的Leeloo——Milla Jovovich,拍了三十年戏。就是这个人,开源了一个AI记忆系统,叫MemPalace。
MemPalace发布到GitHub上,48小时,2万+star。
前几天刚写完今天又刷到一个记忆系统。
两件事说的是同一个方向:AI的记忆不能被筛掉,不管是"只记错误"还是"只记结论",都会丢掉最重要的部分。
一件事在不同地方被独立发现了。
大模型越来越聪明,但不记得你是谁
我每天用AI。聊业务、聊决策、聊判断。有时候一个session聊两三个小时,把一件复杂的事拆得很透彻。然后关掉窗口。第二天再开,它不记得我是谁了。
就像你雇了一个普林斯顿博士生,极其聪明,什么都懂。但他有阿尔茨海默症。
Milla遇到的是同一个问题,只不过场景更具体。
她在做一个大型游戏项目,用AI辅助设计——世界观、角色设定、关卡逻辑。做着做着她发现,每次开新session,之前的设计细节全没了,走过的弯路得重新走,做过的权衡得重新做。AI每次都在给她一个"全新的建议",而不是一个"了解这个项目的合作者"。
她想了想,觉得解决记忆这件事,比继续做游戏更重要。干脆停掉游戏,专门来解决这个问题。
不要AI自己决定记什么
Milla不是第一个想到这件事的人。她去试了Mem0和Zep。这是目前最主流的AI记忆产品,有专业团队,有融资,在行业里被广泛推荐。
用完之后,她发现两个产品有同一个问题。
这两个产品的逻辑是:让AI自己来判断什么值得保存。对话结束后,AI会提炼摘要,把"重要的事"存下来。听起来很合理。
但问题来了。AI保留的是结论。
你当时为什么做这个决策、推翻了哪些备选方案、接受了哪些代价、纠结了多久——这些东西被当成"冗余信息"扔掉了。下次你问"当初为什么选这个方向",它不知道。它只知道你选了什么,不知道你怎么想的。
Milla说她想要的不是这个。她想要AI记住推理的过程,不只是结论。那些被推翻的方案、改变主意的原因,才是最有价值的部分。
结论是死的,推理过程是活的。
这不是技术问题,是设计问题——谁来决定什么值得记?
信息放对了地方,比算法更聪明
Milla找了老朋友、工程师Ben Sigman。两个人合作了6个月。她负责架构逻辑,Ben写代码。
起点是一个简单的想法:不让AI决定记什么。全存。但存下来要能被找到。
"全存"听起来简单,实际上是个很大的工程判断。大多数人做记忆系统,首先想的是怎么"筛选"。Milla的判断反过来:筛选会丢东西,不如全留,把检索做好。
设计灵感来自古罗马的记忆宫殿术。古人记忆大量内容的方法,是在脑子里建一座宫殿,把要记的事情放在不同的房间里,需要时走进去取。结构帮助检索,而不是大脑帮助筛选。
MemPalace的架构就是这么来的。每个项目、每个人、每个主题,对应一个"翼楼"(Wing)。翼楼里按话题分"房间"(Room)。房间之间有"走廊"(Hall),按记忆类型分类:决策、里程碑、偏好、发现。最底层,存的是原始对话完整文本,一个字不删。
数据验证了这个判断。不加任何分类,你想找的东西能被找出来的概率是60.9%;加了项目分类和话题分类之后,直接拉到94.8%。差了34个百分点——不是算法更聪明了,是信息放对了地方。
这套系统,Milla坚持做成了完全本地运行的——不上云,不调外部API,数据不离开你的电脑。存储成本一年0.7美元。在LongMemEval——AI记忆领域的标准基准测试——上跑出了96.6%,是所有不依赖额外API方案里的最高分。
龙虾的记忆其实也是这个设计方向:用文件系统,不用向量数据库。文件你能直接打开看、改、搜索;向量数据库你不知道AI到底存了什么。可以被人看到的记忆,信任成本低得多。Milla做的这套,本质上是同一个判断。
与其看起来厉害,不如做对的事
这个项目我觉得有意思的地方,不只是技术。
它发布没多久,社区就把数据扒了。压缩效果夸大了,满分是加了外援跑出来的,有个功能根本没接进去。挑出来的全是真问题。
但他们没删评论,写了封公开信,一条条认。
最后一句话是:"与其看起来厉害,不如做对的事。"
然后star继续涨。
我觉得这说明了一件事:真正站得住的,是那个96.6%。扒皮之后反而比发布时更可信——因为该夸的地方认了,剩下的才是真的。
更好的记忆
一个演员和一个工程师,6个月,没有大团队,没有融资,在AI记忆这个方向上跑出了行业最高分。
方向其实已经清楚了。
不是更聪明的模型,是更好的记忆。
最后,如果你想体验龙虾为工作提效,现在就可以试试:
国内版:easyclaw.cn
国际版:easyclaw.com
企业版:easyclaw.work
热门跟贴