打开网易新闻 查看精彩图片

如果你用过 ChatGPT 或任何一款 AI 助手,大概率有过这样的崩溃时刻——

你花了半小时教它你的项目结构、偏好习惯、代码风格,关掉对话窗口,下次打开,它又是一张白纸,什么都不记得。

这不是在抱怨某款产品,这是当下几乎所有 AI 工具的共同局限:它们没有记忆,也没有成长。每次对话,都是一次「失忆后的重新认识」。

直到 Hermes Agent 出现。

打开网易新闻 查看精彩图片

这个由 Nous Research 开发的开源项目,在 GitHub 上迅速斩获 10 Star,跻身全球最受关注的 AI 基础设施项目之列。因为发音相似,中国开发者直接叫它「爱马仕」。

它的核心定位只有一句话:

The agent that grows with you. (跟你一起成长的智能体。)

(项目地址:https://github.com/NousResearch/hermes-agent

下面我们拆开来看。

AI Agent,究竟「卡」在哪里?

先说清楚背景,不然后面的内容会显得很虚。

过去几年,AI 领域有一条清晰的进化路径:从「聊天机器人」到「代码补全工具」再到「能执行任务的 Agent」。如今 Claude Code、Cursor、Devin 这类工具,已经能帮你写代码、跑命令、找 Bug。

但用久了你会发现一个根本问题:它们只有「短期工作记忆」,没有「长期学习能力」。——就像雇了一个聪明绝顶的实习生,但他每天早上来上班都要从零开始自我介绍。

具体表现是:

你昨天告诉它「我们项目用 tabs 缩进,不用 spaces」,今天它又用 spaces 了。

你上周花了两个小时教它部署流程,这周又得从头来一遍。

它做过一件复杂的事,没有任何「经验积累」——下次遇到类似任务,还是要重新摸索。

这背后的技术原因并不复杂:现有 Agent 框架普遍缺乏跨会话的持久化记忆,更缺乏从任务执行中自动提炼知识的机制。每次对话都是一个独立的上下文气泡,结束即消散。

Hermes Agent 试图解决的,正是这个问题。

核心设计:一个会「进化」的闭环

Hermes 的架构并不复杂,但理念相当清晰:把一个 AI Agent 拆解成三层能力——记住人、积累知识、理解你的习惯——让这三层相互配合,形成一个持续强化的闭环。

第一层:持久记忆——它真的记得你。

大多数 AI 工具「记住你」的方式,是把上下文全塞进一个超长 prompt 里,既浪费 Token,又容易把关键信息淹没在噪音中。

Hermes 的做法更精细:它维护两个独立的记忆文件—— MEMORY.md(约 800 Token,存储项目环境、踩坑记录、关键约定)和 USER.md(约 500 Token,存储用户画像:你是谁、习惯什么语言、喜欢简洁还是详细)。这两个文件在每次会话开始时,以「冻结快照」的形式注入系统 prompt——既保证关键信息始终在场,又控制了 Token 成本。

更重要的是,Agent 会主动管理这些记忆。当你纠正它的做法、当它遇到新的项目约定、当你明确说「记住这个」,它会自动更新记忆文件,不需要你手动维护。

此外还有兜底机制:所有历史会话存在本地 SQLite 数据库(支持 FTS5 全文搜索),配合 LLM 摘要,可以找回几周前某次具体对话的内容。

第二层:技能系统——经验可以被固化。

这是 Hermes 最有意思的设计之一。

传统 Agent 做完一件事就结束了,知识不会留存。Hermes 引入了一个「程序性记忆」机制:当 Agent 完成一项复杂任务——比如反复调用多个工具、走过错误路径后找到正确解法——它会自动将这个过程固化为一个可复用的技能文件(SKILL.md)。

这个技能文件存放在 ~/.hermes/skills/ 目录,包含触发条件、操作步骤、已知的坑和修复方式。下次遇到类似任务,直接调用,不用重新摸索。

技能采用「渐进式披露」策略——先看目录、用到再读详情,不把所有知识一股脑塞进脑子里:Agent 先看技能名单(仅需少量 Token),需要时再读完整内容。这样既保持了丰富的知识库,又不会在每次对话开始就把上下文撑爆。你还可以从在线技能市场(agentskills.io)安装别人分享的技能包——类似「给 Agent 安装插件」,但知识可以在使用中不断迭代更新。

第三层:用户建模——它会理解「你这个人」。

Hermes 可选集成 Honcho 用户建模系统,进一步增强用户理解能力。它不只是记录你说过什么,而是试图理解你的行为模式:你倾向于先问方案还是直接要代码?你喜欢短平快的回答还是详尽的解释?你的技术水平在哪个层级?

随着交互积累,这个模型越来越精准,Agent 的回应也越来越「懂你」。这是一种类似「老搭档效应」的体验——对方不需要你每次都把背景从头解释一遍。

三层能力形成闭环:记忆提供上下文、技能沉淀经验、用户建模让交互更精准。而连接它们的,是 Hermes 的自学习机制——Agent 每执行一段复杂任务后会自动复盘:哪些步骤失败了?哪些顺序可以优化?有没有可复用的模式?然后据此生成新技能或改进已有策略。在线学习之外,还有离线进化系统,能读取执行日志分析失败原因,双轨并行。

不只是「记忆好」,工程能力也相当扎实

光有记忆和学习还不够。Hermes 在工程落地层面,把一个 AI Agent 该有的基础能力都打磨到位了。

全平台消息接入。统一的消息网关可以同时接 Telegram、Discord、Slack、WhatsApp、Signal,甚至电子邮件。社区已经有人做了微信桥接(HermesClaw),国内用户直接用微信就能调它干活。

定时自动化。内置 cron 调度器,用自然语言配置周期性任务。比如「每天早上 8 点,抓取昨日的技术新闻,总结成摘要发到我的 Telegram」。你下班了它还在跑,你睡觉时它还在监控——从「被动响应工具」变成了「主动工作的数字助理」。

Agent 并行作战。遇到复杂的多步骤任务,主 Agent 自动拆解任务派发给多个子 Agent 并行处理,各自拥有独立上下文。类似公司里「项目经理分配任务给不同专员」的工作模式。

部署环境方面也给了充分选择:本地直接运行、Docker 容器、SSH 远程、无服务器按需唤醒(Modal,闲置时接近零成本)、甚至 HPC 集群。官方明确表示,5 美元/月的 VPS 就能跑起来——实现方式是把「计算密集的推理」外包给云端 API,本地只跑轻量的调度和工具执行逻辑。

多模型支持同样值得称道。Hermes 支持 20+ 家模型提供商,一条命令切换:OpenAI、Anthropic、DeepSeek、智谱 GLM、Kimi、MiniMax、Hugging Face、本地 Ollama 等。国内用户特别值得关注的是对智谱、Kimi、MiniMax 的原生支持——不需要走代理,API 成本更低。唯一的硬性要求是模型需支持至少 64K tokens 的上下文窗口——这是保障技能系统和记忆系统正常运转的基础门槛,主流模型基本都满足。

跟主流 Agent 产品比,差距一目了然:

打开网易新闻 查看精彩图片

上手不难,五分钟的事

看到超 10万 Star 的项目,很多人第一反应是「这玩意儿得多贵才能跑起来」。答案出人意料——上手门槛比大多数人想象的低。

  • 快速上手指南(给圈内朋友):
第一步:安装(Linux / macOS / WSL2) curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash source ~/.bashrc 第二步:配置模型 hermes setup # 交互式向导 hermes model # 选模型:OpenRouter / OpenAI / Claude / Kimi / Ollama 等 第三步:开始用 hermes # 经典 CLI hermes --tui # 现代终端界面,有自动补全(官方推荐) 第四步:接入消息平台(可选) hermes gateway setup # 一键接 Telegram / Slack / Discord 等 常用斜杠命令: /model # 切换模型 /skills # 查看 Agent 已学会的技能 /new # 开始新对话 /compress # 压缩上下文(省 Token) hermes doctor # 运行诊断
  • 模型推荐:日常 Kimi,深度任务 GPT-4o / Claude,隐私场景 Ollama 本地跑。
  • 协议:MIT,商用零限制。

当然,作为仍在快速迭代中的开源项目,它也有不足:技能生态还在成长,部分功能有 Open Issue 待解决,复杂推理的稳定性受制于底层模型。建议从非核心业务场景试点起步。

一个值得关注的行业信号

顺便说一句背景。Nous Research 是在美国注册的 AI 研究实验室,联合创始人兼 CEO Jeffrey Quesnelle 拥有深厚的技术和开源社区背景,团队因 Hermes 系列微调模型(Hermes 2/3/4)在开源社区积累了大量口碑。他们一贯的定位是:不做最大的模型,而是做「模型之外的基础设施」。Hermes Agent 正是这条路线的最新成果——不卷模型参数,卷使用体验和工程能力。

Hermes Agent 本身的功能固然实用,但它背后反映的行业走向更值得关注。

当前 AI Agent 赛道的主要玩家,大多在争「工具调用的广度」和「推理能力的深度」,但在「如何让 Agent 随时间积累价值」这个维度,几乎没有人给出令人满意的答案。

Hermes 的思路是:不试图让模型本身变得更聪明(那是大厂的工作),而是在模型之外构建一套「经验沉淀机制」——

打开网易新闻 查看精彩图片

技能文件是可读可编辑的 Markdown,记忆文件是本地存储的纯文本,整套系统对用户完全透明,没有黑盒。

这种「可解释的成长」,对企业级部署意味着可审计、可维护;对个人用户意味着 Agent 越用越顺手,而不是永远停留在第一天。

还有一个细节:Hermes 的技能格式(SKILL.md)被提交为 agentskills.io 开放标准,不同 Agent 框架之间的技能包有望互通。这是在为整个生态建立基础设施,而不只是做一个封闭的产品。

从今天开始用的人和六个月后再开始用的人,中间差的是半年的「技能复利」——这个差距不是花钱能买回来的。

过去两年,企业用 AI 的方式本质上是「借脑子」——遇到问题去问 ChatGPT,拿回一个答案,然后自己花时间执行。2026 年,范式开始转向:以 Hermes Agent 为代表的新一代 AI Agent,让企业第一次有机会真正「雇一个数字员工」。不是来答问题的,是来干活的。它有记忆,它会学习,它越用越聪明,它积累的技能是你私有的数字资产。

超 10万 Star,数百位贡献者,项目仍在快速迭代——它并不完美,但它代表的方向,大概率会成为下一代 AI Agent 基础设施的标配能力。(本文首发钛媒体App,作者|硅谷Technews,编辑|焦燕