由 Nous Research 团队研发的开源 AI 智能体框架 Hermes Agent(官网: GitHub 热门榜单中连续多月排名第一,累计获得约 4.8 万个 Stars。该项目从 2 月 25 日首次发布至 V0.8.0 版本,更新频率极高,被视为当前最强大的开源 AI Agent 框架之一。
与传统 Agent 工具不同,Hermes Agent 的核心优势在于解决了“用完即忘”的问题,通过以下机制实现能力的持续积累:
Hermes 并非像 OpenClaw 那样依赖用户手动修改配置文件或打包 Skill,而是具备自动进化的能力:
- 触发机制:当任务执行满足特定条件时(如工具调用超过 5 次、中途出错并自我修复、用户纠正错误或发现高效路径),系统会自动生成技能文件。
- 存储位置:生成的技能文件保存在
~/.hermes/skills目录,遵循agentskills.io开放标准,理论上可兼容 OpenClaw、Claude Code 等工具。 - 迭代方式:采用 Patch(打补丁) 而非全量覆写的方式更新技能,既保留了原有有效逻辑,又降低了 Token 消耗,确保安全性。
- 周期性微调 (Periodic Nudge):即使无用户输入,系统也会定期自动回顾操作记录,判断哪些经验值得写入记忆,实现被动式学习。
针对 AI 记忆难题,Hermes 设计了分层检索系统,平衡上下文成本与记忆容量:
- 第一层:常驻提示记忆 (
MEMORY.md,USER.md):存放每次会话必须加载的上下文,字符上限严格控制在 3575 字以内,强制筛选关键信息。 - 第二层:会话归档:基于 SQLite 数据库存储历史对话,利用全文索引检索,并通过 LLM 摘要提取与当前任务相关的片段注入上下文。
- 第三层:技能文件:存储自动生成的操作流程,默认仅加载名称和描述,全文按需调入,支持技能库从 40 个扩展至 200 个而几乎不增加上下文成本。
- 第四层:Honcho(用户建模):可选层,跨会话积累用户的偏好、沟通风格及领域知识,适合长期个人助理场景。
- 操作系统:原生支持 Linux、macOS;Windows 需通过 WSL2 (Windows Subsystem for Linux) 运行;Android 可通过 Termux 终端模拟器安装。
- 依赖处理:安装命令自动配置 Python 3.11、Node.js v22、ripgrep、ffmpeg 及虚拟环境等依赖。
- 模型支持:兼容范围极广,包括 Nous Portal(订阅制)、Anthropic (Claude)、OpenRouter、DeepSeek、Hugging Face、阿里云 DashScope (Qwen)、GitHub Copilot 及任何 OpenAI 兼容接口(含 Ollama 本地模型)。
- 小米接入:小米大模型 Xiaomi MiMo 已正式接入 Hermes Agent,提供为期两周的限免试用(4.8-4.22),支持百万上下文 Token 的 MiMo-V2-Pro 及全模态理解的 MiMo-V2-Omni。
- 辅助模型模块 (Auxiliary Models):底层架构集成了多模型编排能力,将图像分析、网页提取等高频侧任务自动分配给轻量级模型(如默认优先使用 Gemini Flash),降低主模型成本。
- 消息平台:支持 Telegram、Discord、Slack、飞书等,通过统一网关进程管理多平台会话。
Hermes Agent 不仅适用于简单的指令执行,更侧重于需要演化能力的复杂工作流:
- 商业自动化:连接 CRM 系统与知识库,实现客户管理自动化。
- 营销管理:统一内容生成与社群发布流程。
- 软件工程:代码生成与维护中的经验复用。
尽管 OpenClaw 等工具提供了快速上手的入口,但 Hermes Agent 代表了 Agent 从“一次性工具”向“可进化搭档”的演进方向。随着其在真实业务场景中的应用,AI Agent 正加速进入生产环境,尽管目前仍面临安全规范与易用性挑战,但其架构设计为未来通用智能体的发展提供了新范式。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/255942.html