当前多数AI智能体存在一个隐性成本问题——它们擅长单次任务,却记不住自己学会的东西。用户投入数千token让智能体熟悉代码库、调试问题、摸索出有效的工作流,关闭会话后第二天重来,这些上下文大多消失殆尽。代码库还在,但智能体忘了自己学到了什么、如何解决问题、哪种工作流真正奏效。
对于一次性任务,这无关紧要。但当智能体开始处理重复的工程工作、自动化或运维流程时,每次重新发现相同解决方案的代价变得昂贵。
Nous Research推出的Hermes Agent试图改变这一现状。与普通的编程助手或聊天封装不同,Hermes的目标是从成功执行中保留有用的工作流,供后续复用。如果实践中效果良好,这可能显著改变开源智能体的发展方向。
现有智能体框架的典型生命周期是:设定目标→制定计划→调用工具→执行→返回结果→遗忘。这一模式在重复性工作场景下暴露弊端。以扫描代码库、识别缺失的许可证头、生成补丁、运行测试并提交更改为例, capable的系统可能花费大量时间检查文件系统、推断项目规范、从失败中恢复。一周后执行完全相同的任务,多数智能体却从零开始,仿佛之前的执行从未发生。对于反复出现的CI flaky失败等问题,智能体往往重新发现修复方案,而非复用已学到的经验。
Hermes尝试在学习循环中插入关键一步。其目标模型更接近:观察→计划→执行→评估→固化技能→复用。核心差异在于执行后的处理——不再将完成任务视为交互终点,而是评估刚使用的工作流是否值得保留:任务成功了吗?哪些动作真正关键?解决方案是一次性hack,还是可复用的模式?若答案为是,Hermes将该工作流保留为可复用的Skill,而非迫使模型在下次会话中重新发现整个流程。
这比简单的持久化聊天历史更具价值。"程序性记忆"听起来抽象,但具象化后可见其实质:被存储的并非原始对话,而是经过提炼的可执行模式。
热门跟贴