AI Agent的"失忆症"终于有人量化测了。开发团队让两个版本对打:一个每次重启清空记忆,另一个保留历史上下文。结果带记忆的那个胜率是前者的10倍——不是10%,是整整10倍。
这相当于让两个程序员竞争:一个每次开工前被洗掉所有项目记忆,另一个记得上周踩过的坑、被CR打回过的写法、以及架构会上拍板的决策。公平吗?当然不。但现在的Agent产品,卖的大多是那个"失忆版"。
团队把测试过程公开后,评论区最扎心的反馈来自一线开发者:「我的Cursor已经用了8个月,它到现在还不知道我讨厌嵌套三元运算符。」RAG被很多人当作救命稻草,但向量检索和真正的"记住你"是两回事——就像翻聊天记录和真正了解一个人,成本差着数量级。
测试负责人没有给解决方案,只丢了一个数据:他们观察的200多个生产级Agent,93%的会话状态存活不超过4小时。换句话说,绝大多数Agent还没等到"养成",就已经被重启清零了。
热门跟贴