为什么这次更新值得认真看
过去一年,大多数 AI Agent 产品都在做同一件事:让单轮对话变得更快、更聪明。换句话说,它们本质上还是"回答问题"的工具——你问,它答,答完就结束。
但这个模式的瓶颈已经很明显了。
一个真实的办公场景是这样的:你想让 AI 帮你整理这周的产品反馈,提炼出三个核心问题,然后分别发给对应的负责人,最后跟踪每个人的处理进度。这个任务天然是多步骤、跨时间、需要上下文追踪的。用单轮 Agent 来做,要么上下文爆炸,要么中途断层,每一步都得从头解释背景。
行业里管这个叫 Agent 任务的持久化问题。谁能解决好这个,谁就能把 AI Agent 从"高级搜索"变成真正的"数字同事"。
Hermes 这次更新的核心逻辑,就是往这个方向走。
02 Goal:从"问一句答一句"到"盯准目标干活" 2.1 Goal 是什么
简单说,Goal 就是给 Agent 设定一个长期目标,然后让 Agent 自己拆解、规划、执行。
不再是:
用户:"帮我写一份市场报告" → Agent:"好的,这是报告" → 结束
而是:
用户:"这季度我们的目标是用户留存率提升 15%,帮我制定一个行动方案" → Agent 理解目标 → 拆解成多个子任务 → 持续推进 → 过程中根据反馈调整
这个区别非常关键。前者是"响应式",后者是"目标驱动式"。
2.2 为什么重要
目标驱动的价值在于上下文的一致性和任务的连贯性。
当一个 Agent 知道最终目标是什么,它就能:
- 在执行过程中自主判断哪些信息有用、哪些可以忽略
- 当某个子任务失败时,能够回滚并尝试替代方案,而不是直接卡住
- 在多轮对话中保持方向感,不会因为用户的临时提问就跑偏
这其实模拟的是人类"项目经理"的思维模式——不是执行单一指令,而是盯着一个目标,协调资源、调整路径、达成结果。
2.3 背后的技术逻辑
Goal 机制通常依赖子任务拆解(Task Decomposition)+ 自我反思(Self-Reflection) 两个能力。
子任务拆解:将大目标分解为可执行的小任务,比如"提升留存率"可以拆成"分析流失原因 → 设计激活策略 → 上线 A/B 测试 → 收集数据反馈"。
自我反思:每个子任务完成后,Agent 会评估结果是否符合预期,如果不符合就调整下一步计划。这个机制通常通过"检查点"(Checkpoint)来实现,即在关键节点停下来审视当前状态。
这和传统单轮问答的本质区别在于:单轮是"触发-响应",目标驱动是"触发-规划-执行-反思-调整"。
03 Kanban:给 Agent 造一个持久化的工单系统
如果说 Goal 解决了"方向"的问题,Kanban 就是解决"执行力"的问题。
这是我认为这次更新里最值得深入研究的功能。
3.1 传统 Agent 的"任务丢失"问题
用过 AI Agent 的人大概都遇到过这个场景:你让 Agent 做一个多步骤任务,做到第二步的时候,你想去确认第一步的结果,发现 Agent 已经丢失了第一步的上下文。你不得不重新描述背景,效率大打折扣。
这是一个非常实际的问题:Agent 没有持久化的工作记忆。
每次新的对话,Agent 都从零开始。它不记得上次做了什么,不记得哪个任务卡住了,不记得已经尝试过的方案有哪些。
Kanban 要解决的就是这个。
3.2 Kanban 的设计思路
Hermes 的 Kanban 本质上是一个持久化的 Agent 工单系统。每个任务(Task)都作为一个独立的工单存在,有自己的状态、负责人、运行记录和上下文。
它的核心特性包括:
任务分配:任务可以分配给具体的 Hermes Profile 或者 Worker。这意味着你可以让"数据分析 Agent"负责数据处理任务,让"写作 Agent"负责文案任务,各司其职。
依赖关系:任务之间可以设置依赖。比如"整理数据"必须先完成,"分析数据"才能开始。这解决了多步骤任务的执行顺序问题。
运行记录和日志:每次任务执行都会留下日志,包括运行的模型、生成的输出、耗时等。你随时可以回溯"这个结论是怎么得出来的"。
上下文追踪:任务运行时保留完整的上下文,即使中断了,重新拾起时也能无缝衔接,不会丢失之前的进度。
3.3 实际场景举例
一个典型的使用场景:
你是一个产品经理,想让 AI 帮你梳理本月的用户反馈。 任务 A:收集反馈数据(分配给"数据 Worker")任务 B:情绪分析(分配给"分析 Worker",依赖任务 A 完成)任务 C:生成报告(分配给"写作 Worker",依赖任务 B 完成)
你不需要每次都从头描述背景,Kanban 会帮你追踪每一步的状态和结果。如果某一步出错了,你直接定位到那个工单,看日志,定位问题,然后重新执行或调整。
这已经非常接近一个多 Agent 协作的工作流了。
3.4 对比传统单 Agent 方案
特性
单轮 Agent
Hermes Kanban
任务持久化
❌ 每次新建对话丢失
✅ 工单化,跨会话保留
任务分配
❌ 无法分配,只能单一 Agent
✅ 可分配给不同 Worker
依赖管理
❌ 无法设置执行顺序
✅ 支持任务依赖链
运行日志
❌ 无记录
✅ 完整日志追踪
并行执行
❌ 只能串行
✅ 支持并行任务分发
04 Skills:让技能库保持健康
这个功能看起来没有前两个那么"重",但实际上对日常使用体验影响非常大。
4.1 问题是"技能膨胀"
当你的 Agent 积累了大量的 Skills(技能),时间一长就会出现一个问题:有用的技能被淹没在噪音里。
你可能真正每天在用的就那么五六个,但 Skills 列表里有三四十个,找起来费劲,每次加载还吃上下文。
传统的解决方案是手动整理——归档、删除、重新分类。但这个工作枯燥且容易遗忘。
4.2 Hermes 的自动整理逻辑
Hermes 的 Skills 管理引入了一个使用频率驱动的自动整理机制:
- 高频 Skills:保持在主列表,优先展示,随时可用
- 低频 Skills:自动被归到"归档"或"收起"区域,减少主界面的噪音
- 新的 Skills:加入时有观察期,不会一上来就占主空间
这个逻辑很简单,就是让工具去适应人的使用习惯,而不是让人去适应工具的组织方式。
4.3 对 Agent 性能的实际影响
这里有一个很多人忽略的细节:上下文长度是有限制的。
如果你的 Skills 列表很长,每次启动 Agent 都要加载一遍,消耗大量的上下文空间,实际可用于处理任务的有效长度就变短了。
Skills 自动整理本质上是帮 Agent 做了一次上下文减肥,把不常用的东西移出去,保证真正重要的 Skills 和对话内容有足够的空间。
这不只是用户体验的优化,也是性能优化。
05 这三个方向意味着什么 5.1 AI Agent 的发展趋势
从 Hermes 这次更新,可以清晰地看到 2026 年 AI Agent 领域的三个主流方向:
方向一:从工具到助手
单轮回答是工具,能长期跟随目标行动才是助手。Goal 机制代表了从"你说我做"到"你定目标我做规划"的转变。
方向二:从单 Agent 到多 Agent 协作
Kanban 的任务分配和依赖管理,说明 Hermes 正在往多 Agent 协作的方向走。不同的 Agent 负责不同的专业领域,通过工单系统协调,这比一个万能 Agent 什么都会要更现实。
方向三:从手动管理到自动优化
Skills 自动整理是一个缩影。未来的 Agent 会越来越懂得"自我管理"——自动适应用户习惯,自动优化资源分配,主动减少不必要的负载。
5.2 对实际工作的影响
如果你是一个 AI Agent 的深度用户,这些更新会带来几个具体的变化:
- 多步骤项目不再需要反复重新描述背景——Kanban 的上下文追踪让中途切换变得无缝
- 大型任务可以被合理拆解分配——专业的事交给专业的 Agent 来做
- 技能库会越来越"懂你"——不需要手动整理,常用的功能自然浮现
- 目标驱动的任务执行更符合真实工作场景——你定义目标,Agent 负责规划路径
当然,每个新功能都有它的另一面:
Goal 的目标是"正确的"吗? 目标驱动的核心风险在于目标设定本身就有偏差。如果人类给的目标描述不够清晰,Agent 可能会很有"效率"地执行一个错误的方向。这个问题在短期内很难完全解决,需要更好的目标校验机制。
Kanban 的状态管理复杂度上升。当任务有依赖、有分配、有状态流转,出现死锁或循环等待的可能性就会增加。多 Agent 协作系统的调度复杂度远高于单 Agent,这是工程层面的真实挑战。
Skills 自动归档后如何召回? 归档的技能如果需要重新启用,体验是否顺畅?这个细节会影响用户对系统的信任度。
06 避坑清单
- Goal 设定要具体,不要模糊:比如"提升用户留存"和"分析流失原因并提出可落地的方案",后者更能让 Agent 准确理解你的意图。
- Kanban 任务不要拆得太细:依赖关系越多,维护成本越高。如果一个任务可以在一个工单里完成,就不要拆成五个。
- 定期检查归档 Skills:自动归档不等于永久删除,定期看看归档区,防止重要但低频的技能被遗忘。
- 多 Agent 协作时明确职责边界:如果两个 Worker 处理同一个任务,容易出现重复工作或者结果冲突。一开始就定义好职责分工。
- 运行日志是资产:出现问题时先查日志,不要直接重置。Hermes 的日志保留机制就是用来做这个的。
- 目标驱动不是自动驾驶:Agent 会自主规划,但这不意味着可以完全放手。关键节点的结果检查必不可少。
- Day 1:了解 Goal 的基本用法,尝试设定一个简单的长期目标,看 Agent 如何拆解
- Day 2:体验 Kanban,创建一个包含 2-3 个任务的工作流,测试依赖关系
- Day 3:为不同任务分配不同的 Worker,体验任务分配和状态追踪
- Day 4:观察 Skills 的变化,哪些被自动收起,哪些保持在主列表
- Day 5:做一个小型的多步骤项目,比如"本周工作总结",完整走一遍 Goal → Kanban → Skills 的流程
- Day 6:检查运行日志,理解每个任务的执行路径,评估是否有优化空间
- Day 7:复盘整个体验,写下你的使用感受和调整策略,形成自己的最佳实践
Hermes 这次的三个更新——Goal、Kanban、Skills——看起来是三个独立的功能放在一起,但它们的底层逻辑是一致的:让 AI Agent 从"你叫我做什么我就做什么",变成"你告诉我目标,我来规划、执行、追踪结果"。
这个转变不是 Hermes 一家的选择,而是整个行业在 2026 年的共同方向。目标驱动让 Agent 有方向,多 Agent 协作让它有执行力,Skills 自动整理让它保持健康。
剩下的,是持续打磨细节和真实场景验证的问题。
热门跟贴