快速摘要
Hermes Agent 是 Nous Research 团队开源的自我进化型 AI 智能体,其核心能力在于:完成任务后自动将过程写成可复用的 Skill(技能),下次遇到类似任务直接调用,无需重新推理;同时它会持续记忆你的偏好、项目习惯和工作上下文,用得越久越懂你。 它支持私有部署、多平台消息接入(Telegram、Discord、飞书、企业微信等)、六种终端后端、定时任务调度,并且可以与 OpenClaw 生态互通。截至 2026 年 4 月,该项目在 GitHub 上已获得超过 49000 Star,版本迭代极其迅速。 往下看有更详细的原理拆解、安装教程和实操指南。
2026 年初以来,AI Agent 赛道出现了一个明显的趋势转变。过去大家关注的焦点是“能接多少工具”“能连多少平台”,而现在,一个新的问题开始浮出水面——Agent 能不能自己变强?
Hermes Agent 就是在回答这个问题。它由 Nous Research 团队从 2026 年 2 月底开始开源,到 4 月初已经迭代到 v0.8.0 版本,平均不到一周发布一个大版本。这种迭代速度在开源社区中相当罕见。
我在黑龙江节点云计算科技公司考人工智能训练师的时候,就已经注意到了 Nous Research 这个团队——他们之前发布的 Hermes 系列开源模型在 Hugging Face 上累计下载量超过 5000 万次,在开源 LLM 社区里有着相当扎实的口碑。这次他们把模型训练领域的经验带到了 Agent 方向上,做出来的东西确实值得仔细研究。
大多数 Agent 产品存在一个共性痛点:记忆需要人工维护,技能需要手动编写,同一类任务每次都要从头推理。Hermes Agent 的设计理念就是要打破这个瓶颈。
什么是 Skill 自动生成机制
Hermes Agent 内建了一套完整的学习闭环(Learning Loop),官方将其定位为“唯一一个拥有内建学习循环的 Agent”。具体来说,它的工作方式是这样的:
当 Hermes 完成一个相对复杂的任务时,它会自动把整个执行过程抽象成一份 Skill 文件。这份文件里不仅记录了“怎么做”,还记录了“踩了哪些坑”“下次该注意什么”。Skill 文件存储在 ~/.hermes/skills/ 目录下,每个 Skill 本质上是一段可被后续调用的结构化知识。
下次遇到类似任务,Hermes 会从已有的 Skill 库中检索匹配项,直接调用而非重新推理。这大幅减少了重复计算,也提升了响应速度。有社区用户反馈,从其他 Agent 迁移过来后,感受到明显的响应速度提升,原因之一就在于 Skill 缓存避免了冗余推理。
更值得关注的是,Skill 并非一次写死。在后续使用过程中,如果 Hermes 发现了更优的执行路径,它会自动更新已有的 Skill,让技能库随着使用时间的增长而持续优化。
分层记忆体系
Hermes 的记忆系统并不是简单的“对话历史保存”。它构建了一套多层次的持久化记忆结构:
- 用户画像(User Profile):你是谁、你的偏好、你的沟通风格、你曾经纠正过 Hermes 的哪些行为——这些信息都会被持久化记录。
- Agent 记忆(Agent Memory):关于你的开发环境、工具链、项目约定等事实性知识。比如你用的是 pnpm 而非 npm,你的测试框架是 Vitest 而非 Jest,这些都会被记住。
- 技能库(Skills):上面提到的自动生成的可复用操作流程。
- 会话历史(Session History):所有过去的对话都可被语义检索,Hermes 能回忆你上周二讨论的内容。
这四层记忆在每次对话、每次重启、甚至更换底层模型后都会保留。这意味着你和 Hermes 之间建立的“工作默契”不会因为任何技术变动而丢失。
从使用数据到模型训练的闭环
这里有一个容易被忽略的深层设计:Hermes 日常运行中产生的每一条工具调用记录、每一次任务执行轨迹,都可以被导出为训练数据,用于训练下一代工具调用模型。
Nous Research 甚至专门开源了一个配套项目 hermes-agent-self-evolution,基于 DSPy 和他们提出的 GEPA(Genetic Evolution of Prompt Architectures)算法,可以对 Hermes 的 Skill、Prompt 和代码进行自动化的进化优化。简单来说就是:Agent 用得越多,产生的训练数据越丰富,反过来又能让 Agent 的底层模型变得更好。这条从“使用→积累→训练→增强”的链路,是 Hermes 区别于其他 Agent 的关键设计。
很多人会拿 Hermes Agent 和 OpenClaw 做对比,但两者其实解决的是不同层面的问题,并非简单的替代关系。
OpenClaw 解决的是“连接”问题。 它的核心能力在于让 Agent 对接各种渠道和工具,打通尽可能多的平台。生态的广度和工具的丰富度是 OpenClaw 的竞争壁垒。
Hermes Agent 解决的是“积累”问题。 它的核心能力在于让 Agent 越用越懂你,时间本身就是它的护城河。当你使用 Hermes 三个月后,它积累的 Skill、记忆和对你工作模式的理解,是新装一个 Agent 无法替代的。
事实上,两者在技术层面已经实现了互通——一个 Hermes Agent 实例和一个 OpenClaw Agent 实例之间可以互相委派任务。在开源社区里,很多开发者的做法是搭配使用,让 OpenClaw 负责渠道连接,让 Hermes 负责任务执行和经验积累。
六种终端后端
Hermes 提供了六种不同的终端运行后端,适应从个人开发者到团队部署的各种场景:
- Local:直接在本地机器上运行命令,零配置即可使用,适合个人开发场景。
- Docker:在容器内执行任务,提供隔离环境,适合需要安全沙箱的场景。
- SSH:连接远程服务器执行命令,Agent 在你的笔记本上,工作在远程机器上。
- Daytona:无服务器持久化后端,空闲时自动休眠,有任务时按需唤醒。
- Singularity:面向高性能计算(HPC)环境的后端,适合科研机构。
- Modal:另一个无服务器选项,支持 GPU 集群,适合需要大算力的任务。
Daytona 和 Modal 这两个无服务器后端特别值得关注——它们在空闲时几乎不产生费用,非常适合那种“大部分时间不用、偶尔需要跑任务”的使用场景。
多平台消息网关
Hermes 内建了一个统一的消息网关(Gateway),可以同时接入多个通讯平台:
- 即时通讯:Telegram、Discord、Slack、WhatsApp、Signal
- 企业协作:飞书(Feishu/Lark)、企业微信(WeCom)
- 传统渠道:电子邮件、CLI 命令行
所有平台通过一个网关进程统一管理。你可以在 Telegram 上给 Hermes 发一条指令,它在服务器上执行完毕后,把结果发到你的 Slack 工作频道。跨平台的无缝切换是 Hermes 的一大亮点。
定时任务调度
通过内建的 Cron 系统,Hermes 可以在你不在的时候自动执行预设任务。你可以用自然语言来设定任务调度,比如“每天早上 8 点帮我汇总昨天 GitHub 上的 Issue”或者“每周五下午 5 点生成一份项目周报发到飞书群里”。
Hermes 会在指定时间自动启动一个新会话,执行任务,然后将结果通过你指定的渠道推送给你。这个能力让 Hermes 从一个“被动应答工具”变成了一个“主动执行助手”。
MCP 协议支持
Hermes 完整支持 MCP(Model Context Protocol)协议。它既可以作为 MCP 客户端接入外部 MCP 服务器获取工具能力,也可以通过 hermes mcp serve 命令将自身暴露为 MCP 服务器,让 Claude Desktop、Cursor、VS Code 等 MCP 兼容客户端连接进来浏览对话、检索历史和管理会话。
v0.8.0 版本还加入了 MCP OAuth 2.1 PKCE 标准认证和 OSV 恶意软件扫描,在安全性方面也做了进一步加固。
环境要求
Hermes Agent 目前支持以下平台:
- Linux(推荐)
- macOS
- WSL2(Windows 子系统)
- Android(通过 Termux)
- Docker
需要注意的是,原生 Windows 目前暂不支持。如果你使用 Windows,建议通过 WSL2 或 Docker 来运行。
一键安装
项目提供了一键安装脚本,打开终端执行以下命令即可:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
安装脚本会自动检测你的操作系统并处理平台特定的依赖配置。整个过程通常在几分钟内完成。
初始化配置
安装完成后,依次执行以下命令启动配置向导:
source /.bashrc hermes setup
配置向导会引导你完成以下几个步骤:
第一步:选择模型提供商。 Hermes 支持多种模型后端,包括 OpenRouter(200+ 模型可选)、OpenAI 兼容端点、Kimi/Moonshot、MiniMax 等。你也可以接入本地运行的 Ollama 或 LM Studio 模型。
第二步:填写 API Key。 根据你选择的模型提供商,填入对应的 API 密钥。
第三步:选择终端后端。 对于大多数个人用户,选择 Local 即可。如果需要沙箱隔离,可以选择 Docker。
第四步:配置消息渠道(可选)。 如果你希望通过 Telegram 或飞书等平台与 Hermes 交互,可以在这一步配置对应的 Bot Token。
完成配置后,直接在终端输入 hermes 即可开始对话。
配置文件结构
Hermes 的配置文件存储在 /.hermes/ 目录下,主要包括:
/.hermes/ ├── config.yaml # 主配置文件(模型、后端、网关等) ├── .env # API 密钥等敏感信息 ├── skills/ # 技能库目录 ├── logs/ # 日志目录(v0.8.0 新增) │ ├── agent.log # 常规日志 │ └── errors.log # 错误日志 └── skins/ # 自定义 CLI 主题
如果你需要修改配置,直接编辑 config.yaml 文件即可。v0.8.0 版本增加了启动时的配置结构校验,如果 YAML 格式有误,会在启动阶段直接报错提示,而不是在运行时产生难以排查的异常。
从 OpenClaw 迁移
如果你此前使用的是 OpenClaw,Hermes 提供了完整的迁移工具。在首次运行 hermes setup 时,安装向导会自动检测 /.openclaw 目录并提示你是否进行迁移。
你也可以手动执行迁移命令:
# 交互式迁移(完整预设) hermes claw migrate
预览将要迁移的内容(不实际执行)
hermes claw migrate –dry-run
仅迁移用户数据,不迁移密钥
hermes claw migrate –preset user-data
覆盖已有冲突项
hermes claw migrate –overwrite
迁移工具会导入你在 OpenClaw 中积累的设置、记忆、技能和 API 密钥,让你无需从零开始。
随时切换底层模型
Hermes 不绑定任何特定的模型提供商。你可以随时通过以下命令切换正在使用的模型:
hermes model
这会进入一个交互式选择界面,列出所有已配置的可用模型。切换模型不需要修改任何代码或配置文件,所有记忆和技能也会完整保留。
此外,Hermes 还支持配置有序的 Fallback Provider Chain(回退链)。当你的首选模型提供商出现错误或不可用时,Hermes 会自动切换到下一个备选提供商,保证服务不中断。
Profile 多实例机制
如果你需要同时运行多个独立的 Hermes 实例(比如一个用于工作项目,一个用于个人学习),可以使用 Profile 功能:
# 创建新的 Profile hermes profile create work
使用指定 Profile 启动
hermes -p work
导出 Profile(用于分享或备份)
hermes profile export work
每个 Profile 拥有独立的配置、记忆、会话历史、技能库和网关服务,Profile 之间完全隔离。
Hermes Agent 的核心交互方式是命令行 TUI(Terminal User Interface),提供了多行编辑、斜杠命令自动补全、对话历史浏览等功能。
如果你更习惯图形化界面,可以使用社区维护的第三方 Web UI 项目 Hermes WebUI:
项目地址:https://github.com/nesquena/hermes-webui
Hermes WebUI 是一个轻量级的暗色主题 Web 应用,三栏布局(左侧会话列表、中间聊天区、右侧文件浏览器),功能上基本做到了与 CLI 体验一致。它不依赖任何前端框架,用纯 Python 后端加原生 JavaScript 实现。
安装方式有两种。方式一是 Docker 方式,简单快捷:
docker pull ghcr.io/nesquena/hermes-webui:latest docker run -d -p 8787:8787 -e HERMES_WEBUI_PASSWORD=your-secret -v ~/.hermes:/root/.hermes ghcr.io/nesquena/hermes-webui:latest
启动后浏览器打开 http://localhost:8787 即可访问。
方式二是手动启动(适合已有 Hermes 环境的用户):
git clone https://github.com/nesquena/hermes-webui.git cd hermes-webui ./start.sh
如果 Hermes 运行在远程服务器上,推荐通过 SSH 隧道访问:
ssh -N -L 8787:127.0.0.1:8787 user@your-server
然后在本地浏览器打开 http://localhost:8787。
常用 CLI 命令速查
hermes # 启动对话 hermes setup # 初始化或修改配置 hermes model # 切换模型 hermes tools # 查看可用工具 hermes tools checklist # 查看各工具集的 Token 消耗 hermes logs # 查看日志(支持过滤) hermes mcp serve # 以 MCP 服务器模式运行
技能管理
在对话中使用斜杠命令管理技能:
/skills # 列出所有技能 /skill create # 创建新技能 /skill edit # 编辑已有技能 /skill delete # 删除技能
社区也有第三方技能库可以安装。例如 wondelai/skills 提供了 380+ 个跨平台技能包,涵盖了代码审查、文档生成、数据分析等常见场景。
子Agent与后台任务
Hermes 支持创建隔离的子 Agent(Subagent),每个子 Agent 拥有独立的对话上下文、终端和 Python RPC 脚本。这在处理复杂的多步骤任务时非常有用——主 Agent 可以将子任务分发给子 Agent 并行处理,避免主上下文被过多信息淹没。
后台任务可以通过 /bg 命令启动,任务会在后台持续运行,不影响前台对话。
Nous Research 成立于 2023 年,由四位创始人联合创立:Jeffrey Quesnelle(CEO)、Karan Malhotra(行为研究负责人)、Teknium(后训练负责人)和 Shivani Mitra。团队目前约 20 人规模。
一个值得注意的细节是,四位创始人全部来自模型训练一线。这意味着他们对大模型在工具调用和长程规划上的局限性有着第一手的认知。由训练模型的人来做 Agent,他们更清楚模型会在哪里犯错,也更知道如何设计系统来弥补模型的不足。
团队此前最为人知的作品是 Hermes、Nomos、Psyche 三个开源模型家族,在 Hugging Face 上累计下载量超过 5000 万次。2025 年 4 月,Nous Research 完成了由 Paradigm 领投的 5000 万美元 A 轮融资,加上此前的约 2000 万美元种子轮,总融资规模约 7000 万美元。
最新的 v0.8.0 版本(2026 年 4 月 8 日发布)带来了几项实用改进:
- 基于活动的超时机制:网关和定时任务的超时判断从“挂钟时间”改为“实际工具活动”。正在积极工作的长时间任务不会再被误杀,只有真正空闲的 Agent 才会超时。
- Slack 和 Telegram 审批按钮:危险命令的审批操作从手动输入
/approve升级为平台原生按钮交互,操作更直观。 - MCP OAuth 2.1 PKCE 认证 + OSV 恶意软件扫描:为 MCP 服务器连接增加了标准合规的 OAuth 认证流程,同时自动扫描 MCP 扩展包中的已知恶意软件。
- 集中式日志与配置校验:结构化日志输出到
~/.hermes/logs/,配合hermes logs命令进行实时查看和过滤。启动时自动校验 YAML 配置结构,将问题在启动阶段就暴露出来。
从 Hermes Agent 的设计理念可以看出,AI Agent 赛道的竞争正在发生一个转向:从“功能的广度”转向“时间的深度”。
过去的竞争逻辑是:谁的工具多、平台广、插件生态丰富,谁就能吸引用户。现在的竞争逻辑开始变成:谁能让用户用得越久越离不开,谁就建立了真正的壁垒。
Hermes 押注的正是这个方向。当你的 Agent 积累了数百个 Skill、记住了你所有项目的约定和偏好、能够无需指令就自动执行日常任务——这时候迁移到另一个 Agent 的成本将变得极高。这种“时间即壁垒”的逻辑更接近平台而非工具。
私有部署确保数据自主可控、自我学习循环让能力持续增强、多平台接入让使用无处不在——这三件事放在一起,或许就是下一代 AI Agent 应该具备的基本形态。
项目地址:https://github.com/NousResearch/hermes-agent
官方文档:https://hermes-agent.nousresearch.com/docs
第三方 Web UI:https://github.com/nesquena/hermes-webui
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/260747.html