同一个Agent打擂台，带记忆的版本10倍碾压

薛定谔的BUG

2026-04-11 09:58 ·北京

AI Agent的"失忆症"终于有人量化测了。开发团队让两个版本对打：一个每次重启清空记忆，另一个保留历史上下文。结果带记忆的那个胜率是前者的10倍——不是10%，是整整10倍。

这相当于让两个程序员竞争：一个每次开工前被洗掉所有项目记忆，另一个记得上周踩过的坑、被CR打回过的写法、以及架构会上拍板的决策。公平吗？当然不。但现在的Agent产品，卖的大多是那个"失忆版"。

团队把测试过程公开后，评论区最扎心的反馈来自一线开发者：「我的Cursor已经用了8个月，它到现在还不知道我讨厌嵌套三元运算符。」RAG被很多人当作救命稻草，但向量检索和真正的"记住你"是两回事——就像翻聊天记录和真正了解一个人，成本差着数量级。

测试负责人没有给解决方案，只丢了一个数据：他们观察的200多个生产级Agent，93%的会话状态存活不超过4小时。换句话说，绝大多数Agent还没等到"养成"，就已经被重启清零了。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴