大多数人用 AI 聊天工具,就是问问题、要答案。但 Hermes Agent 不一样——它跑在 Telegram、Discord、飞书、微信这些聊天平台上,不仅能对话,还能直接动手干活。
同一个聊天窗口,你可以让它写代码部署上线、定时抓数据、操控家里的灯、读网页、生成图片、管理 GitHub……这不是概念,是现在就能用的功能。
下面 20 个功能,全部在聊天框里一句话触发,不需要切换到终端。
发一条消息,Hermes 就在你的服务器上跑命令。装软件、查日志、重启服务,跟 SSH 上去一样,但不用敲键盘。
帮我查一下 nginx error log 里最近 10 条 502 错误
它会自己 tail + grep,把结果整理好发回来。
不需要打开编辑器。告诉它文件路径,它能读、能写、能精准替换某一段。
把 ~/project/config.yaml 里的 timeout 从 30 改成 60
不是覆盖整个文件,是精准找到那一行改掉。
丢一个 URL 过去,它能自动打开、抓取正文、提炼关键信息。
帮我看看 https://arxiv.org/abs/2504.xxxxx 这篇论文的核心贡献
比你自己打开看快得多,而且它会把技术细节翻译成人话。
不是简单的 HTTP 请求,是真正操控一个浏览器。填表单、点按钮、截图、处理需要登录的页面。
帮我登录公司内网抓一下这个月的考勤记录
它打开浏览器,导航到页面,输入账号密码(从你的安全配置里读取),完成操作。
在聊天里就能创建定时任务,到点自动执行,结果发回聊天窗口。
每天早上 9 点帮我搜索 Hacker News 前 10 条 AI 相关新闻,发到这里
它内部创建 cron job,用自然语言指定调度规则,支持一次性任务和循环任务。
发一张图片给 Hermes,它能看懂内容。截图报错、架构图、手绘草图,都能处理。
[发送截图] 这个报错是什么原因?
它会分析图片内容,结合你的项目上下文给出诊断。
不只是文字,它还能画图。描述你想要的图片,它直接生成。
帮我画一张暗色系的系统架构图,包含 API Gateway、微服务集群和数据库
它调用图片生成工具,生成的图片直接发到聊天里。
Hermes 同时连着 Telegram、Discord、飞书、微信等多个平台。你可以让它把消息从一个平台发到另一个。
把刚才那个分析结果发到 Discord 的 #engineering 频道
它会自动找到目标频道,格式化内容并发送。
不记得之前聊过什么?让它自己翻记录。
上周我们讨论的那个 Kubernetes 部署方案是什么来着?
它会搜索所有历史会话,找到相关内容,总结给你。
它会记住你的偏好、项目结构、常用命令。不需要每次都重新交代背景。
按我们之前定的风格写一篇关于 WebAssembly 的文章
它从记忆里调出你的写作风格偏好,直接按套路来。
一个任务可以拆成多个子任务,并行执行。比如同时调研三个技术方案。
帮我并行调研 Rust、Go、Zig 三个语言做 AI Agent 开发的生态现状
它会 spawn 三个独立的子 Agent,各自调研,最后汇总结果。
管理仓库、创建 PR、review 代码、处理 Issue,全部在聊天里完成。
帮我把刚才改的代码 commit 并 push 到 main 分支
它自动执行 git 操作,处理冲突,推送到远端。
Hermes 会学习。解决过一个复杂问题后,它能把流程保存为 skill,下次直接复用。
把这个发布流程保存为 skill,以后我说"发布"就走这个流程
你也可以安装社区分享的 skill,给它加载新的专业能力。
回复太长不想看?让它念给你听。
用语音把刚才的总结念一遍
它生成语音消息,在 Telegram 上直接播放,在微信里以音频附件发送。
你发语音,它自动转成文字理解,然后文字回复(或语音回复)。
[发送语音消息] 帮我把这段会议纪要整理成任务清单
它用 Whisper 或本地模型转录,然后处理内容。
连上 Home Assistant 后,聊天框就是你的智能家居遥控器。
把客厅灯调到暖光 40% 亮度
它直接调用 Home Assistant API,比掏手机打开 App 还快。
Model Context Protocol 让 Hermes 能连接外部工具服务器——数据库、API、内部系统。
连上我们的 PostgreSQL,查一下最近 7 天的日活数据
它通过 MCP 协议对接数据库,执行查询,格式化结果。
可以配置 Webhook 端点,外部事件(GitHub push、报警触发)自动通知到聊天。
帮我设置一个 webhook,当代码仓库有新的 PR 时通知我
它创建 webhook 路由,配置好接收和通知逻辑。
有些任务跑得久——编译、训练、批量处理。Hermes 能在后台运行,完成后自动通知。
帮我跑一下测试套件,完了告诉我结果
它在后台执行,你可以继续聊别的。跑完了主动发消息通知你。
不挑模型。OpenRouter、Anthropic、DeepSeek、Gemini、GLM……20 多个提供商随时切换。
切换到 DeepSeek 模型帮我跑这个推理任务
甚至可以配置智能路由:简单问题用便宜模型,复杂问题自动升级。
这 20 个功能不需要打开终端、不需要写代码、不需要安装额外软件。打开你的 Telegram 或飞书,像跟同事聊天一样,把需求说出来就行。
这就是 Hermes Agent 的设计理念:AI 不是另一个工具,是融入你日常工作流的队友。 它住在你的聊天工具里,有手有脚(能执行命令、操作文件),有眼睛(能看图片、读网页),有记忆(记住你的偏好和历史),还能叫帮手(子 Agent 并行)。
如果你已经在用 Claude Code 或 Cursor 做开发,Hermes 补充的是”不在电脑前”那个场景——手机上、通勤路上、开会间隙,一句话就能让 Agent 干活。
官网:https://github.com/NousResearch/hermes-agent
——来自公众号:人生几十年噢耶
作者: itech001
来源: 公众号:AI人工智能时代
主页: https://www.theaiera.cn,每日分享最前沿的AI新闻和技术。
本文首发于 AI人工智能时代,转载请注明出处。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/283328.html