9个月,36800 Star,每周一个大版本。Nous Research 的 Hermes Agent 不是又一个套壳 ChatGPT——它可能是目前开源 AI Agent 框架里,架构设计最值得研究的一个。
今天不聊概念,直接拆架构、看代码、讲场景。
如果你是开发者、技术负责人、或者正在评估”用哪个 Agent 框架”,这篇值得收藏。
市面上 AI Agent 框架多如牛毛,但 Hermes Agent 精准打中了三个痛点:
1. 记忆断裂——每次新对话都从零开始,上次教过的工作流程全忘了 2. 能力天花板——用多久都是那个水平,不会因为用得多就变强 3. 平台绑定——绑死在一个模型供应商上,换不了,也搬不走
Hermes 的解法是:四层记忆 + 自主技能进化 + 完全模型无关。
这不是功能堆叠,是三个设计决策互相咬合后涌现出来的系统能力。下面一层层拆。
大部分"有记忆"的 Agent 做法很粗暴:把历史对话塞进 context window,或者写个记忆文件每次加载。这种方案的问题是——要么 Token 成本随时间线性增长,要么信息密度太低没用。
Hermes 设计了一套 四层缓存感知的记忆体系,每层对应不同的信息生命周期:
核心参数和关键偏好,直接注入系统提示词,每次对话都在。
硬性上限:3575 字符。
这个设计很克制。不是越多越好,而是强制精炼——就像 CPU 的 L1 缓存,容量小但命中率极高。Agent 会通过自省机制,持续评估哪些信息值得留在这一层。
所有历史对话存入 SQLite,使用 FTS5 全文搜索引擎建索引。
工作方式:不占常驻上下文 → 需要时按关键词检索 → LLM 摘要后注入当前对话。
类比:这是你的"工作笔记本"。不用翻的时候不占桌面空间,需要时快速定位、提取关键信息。
Agent 自动生成的"操作手册",以 Markdown 格式存储。
这是最有意思的一层。 默认只加载技能名称和一行摘要(几十个 Token),只有判断当前任务与某个技能相关时,才加载完整内容。
这意味着:哪怕 Agent 积累了 200 个技能,常驻开销也只是一个简短列表。按需加载,不是全量加载。
被动跟踪用户的 12 个维度:沟通风格、技术栈偏好、时区习惯、常用工作流等。
不需要你主动告诉它"我喜欢什么",它从交互中自动提炼。用的时间越长,画像越精准。
系统提示词在会话开始时拍快照、冻结,运行过程中不再反复重建。高频调用路径走缓存。
这意味着:记忆越来越多,但 Token 成本不会线性增长。这是 Hermes 和大部分竞品在架构层面的本质差异。
四层记忆是基础设施,但真正让 Hermes "越用越强" 的是它的 自主学习闭环。
Agent 在固定间隔收到一个内部"自省信号"(nudge),主动回顾近期任务。不需要你触发。
当一个任务满足以下任一条件,Agent 会自动把成功路径提炼为技能文档:
- 工具调用次数 ≥ 5
- 过程中出现错误恢复
- 用户中途纠正过操作方向
技能文档格式是标准 Markdown,包含:触发条件、前置检查、操作步骤、常见异常处理。兼容 agentskills.io 开放标准,这意味着社区技能可以互相复用。
执行某个已有技能时发现更优路径?Agent 会用 patch 模式(局部更新而非全量重写)更新技能文档。
这个设计选择很关键——全量重写有丢失已验证步骤的风险,patch 模式更安全,也更省 Token。
社区实测数据:Agent 自动创建 3 个技能文档后,同类任务执行速度提升约 40%,工具调用次数减少约 30%。
翻译成人话:它的学习方式不是"记住答案",而是"提炼方法论"。
Nous Portal / OpenRouter(200+ models) ├── OpenAI(GPT系列) ├── Anthropic(Claude系列) ├── Google AI Studio(Gemini系列) ├── z.ai / GLM / Kimi / Moonshot / MiniMax ├── Hugging Face(开源模型) └── 自定义 OpenAI-compatible endpoint
切换方式:hermes model 一条命令,不改代码。
这不是简单的”多模型支持”。Hermes 内置了 Smart Routing——根据任务复杂度、成本预算、响应速度要求,自动选择最合适的模型。简单查询走便宜快速的模型,复杂推理走旗舰模型。
Telegram、Discord、Slack、WhatsApp、Signal、Email、DingTalk、飞书/Lark、WeCom(企业微信)、Matrix、Mattermost、SMS、Home Assistant、Webhook、API Server。
不是"接入"这么简单——支持跨平台会话连续性。 你在 Telegram 上和 Agent 聊到一半,切到飞书继续,上下文无缝衔接。
环境空闲时自动休眠,不产生费用。一台 $5/月的 VPS 就能跑起来。
4 月 8 日刚发布的 v0.8.0 被称为"The Intelligence Release",209 个 PR:
Agent 在后台执行长时间任务时,可以主动通过你选择的消息平台推送进度和结果。不用守着终端等。
通过 Nous Portal 免费提供 MiMo v2 Pro 模型——这是一个专为 Agent 场景优化的模型,工具调用和多步推理能力突出。
Model Context Protocol 支持 OAuth 2.1 认证,意味着可以安全接入企业级 MCP 服务。
在所有消息平台上支持运行时切换模型,不需要重启 Agent。
- 主动扫描 URL 编码、base64 编码的潜在泄露
- 提示注入检测
- 凭证池轮换 + 自动故障转移
# 安装 pip install hermes-agent
# 配置模型(推荐先用免费的 Nous Portal) hermes model set nous-portal
# 启动 hermes start
**实践:
- 前两周不要急着手动创建技能,让 Agent 通过自然交互自动学习
- 每周检查一次 Prompt Memory,删除过时信息
- 用
hermes skill list查看自动创建的技能,手动修剪低质量的
用 Docker + API Server 模式部署,团队成员通过飞书/Slack 接入。
**实践:
- 用 Profiles 功能为不同项目创建独立上下文
- 配置凭证池(v0.7.0+),多个 API Key 自动轮换
- 敏感项目启用 Docker 终端后端,隔离代码执行环境
- 设置 Cron 任务自动执行日报汇总、代码审查等周期性工作
Hermes 内置了 trajectory 生成和 Atropos RL 环境集成,可以用 Agent 的实际交互数据训练下一代工具调用模型。
**实践:
- 用 batch trajectory generation 批量生成训练数据
- 配合 Modal 后端使用 GPU 资源
- 利用 trajectory compression 降低数据冗余
通过 Home Assistant 集成,用自然语言控制智能设备,支持跨设备联动、定时任务。
**实践:
- 把常用的设备控制流程让 Agent 自动提炼为技能
- 用 Cron + 消息推送做"智能提醒"
核心差异总结:
- vs Claude Code:Hermes 不锁模型、可远程部署、多平台接入、有自主学习。Claude Code 在纯编码场景的交互体验更丝滑。
- vs Cursor:完全不同的产品形态。Cursor 是 IDE,Hermes 是可编程的 Agent 平台。
- vs AutoGPT:同为开源 Agent 框架,但 Hermes 的记忆系统和技能进化在工程成熟度上领先一代。
- vs LangChain Agent:LangChain 是库,Hermes 是完整平台。如果你想快速搭建,Hermes 即装即用;如果你需要高度定制,LangChain 更灵活。
诚实讲几个问题:
1. Token 成本不透明
自托管省的是平台费,但模型调用费是另一回事。社区有人记录:简单 Bug 修复约 187。Smart Routing 能优化,但你需要自己监控。
2. 记忆上限偏紧
Prompt Memory 的 3575 字符限制在复杂企业场景下可能不够。多项目并行时需要频繁切换 Profile。
3. 安全性需要持续关注
前身 OpenClaw 曾曝出 Token 泄露等安全漏洞。v0.7.0+ 在安全上投入很大,但开源自托管意味着安全责任在你自己。
4. 社区生态仍在早期
agentskills.io 的技能市场刚起步,质量参差不齐。短期内大部分技能还是得靠自己的 Agent 积累。
5. 发布节奏过快
3 周 5 个大版本——对尝鲜者是好事,对稳定性有要求的团队可能需要等 LTS 版本。
Hermes Agent 代表了 AI Agent 赛道的一个重要方向转移:从”一次能做多少事”转向”同一件事能越做越好”。
过去两年,Agent 框架的竞争焦点是工具数量、平台接入、任务链长度——这些是”广度”。Hermes 提出了”深度”竞赛:通过记忆和技能进化,让 Agent 在持续使用中积累经验。
这更接近人类的工作方式。一个用了你三个月的 Hermes Agent,理论上比任何新开的 AI 对话都更了解你的工作习惯和代码风格。
对于三类人,我建议现在就试:
- 独立开发者 / 自由职业者——$5/月 VPS + 免费 Nous Portal 模型,性价比极高的私人 AI 助手
- 对 Claude Code 有”模型锁定焦虑”的团队——Hermes 的 200+ 模型支持是最好的对冲
- AI 研究者——内置 RL 训练管线,可以直接用 Agent 交互数据训练模型
不建议现在用的场景: 对稳定性要求极高的生产环境。等它出 LTS 版本再说。
项目信息 GitHub:github.com/NousResearch/hermes-agent(36,800+ Stars) 官网:hermes-agent.nousresearch.com 当前版本:v0.8.0(2026年4月8日) 许可证:MIT(完全免费开源) 安装:
pip install hermes-agent社区:discord.gg/NousResearch
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/274888.html