拆解2026年4月GitHub上最火的三个AI编程项目——Hermes Agent(自进化Agent/4.7万星)、Claude Code(SWE-bench 80.8%编程第一)、Superpowers(工程纪律框架/14.4万星),看它们怎么组成”执行层+纪律层+学习层”的完整编程工具链。文章基于Go微服务场景给出了实战配置方案和踩坑记录。
最近两周GitHub Trending被三个项目轮流霸榜:Hermes Agent单日涨6485星总量破4.7万、Superpowers日增2299站稳14.4万、Claude Code在SWE-bench Verified跑到80.8%坐稳编程能力第一。更有意思的是,社区自发把这三个东西拼成了一套”AI编程三件套”——还真跑通了生产级项目。
在大厂写了十多年Go,我花了两周把这套组合拉到实际项目里跑了一圈。这篇不聊概念,聊落地。
1.1 Claude Code:编程执行层
Claude Code是Anthropic的agentic coding tool,不是聊天窗口里的代码补全,是能直接读代码库、改文件、跑命令的终端Agent。
硬指标:
80.8%什么概念?扔100个真实GitHub issue给它,超过80个能自主修复。对比一年前GPT-4的45%左右,进步幅度不小。
1.2 Superpowers:工程纪律层
Jesse Vincent开发的AI编程Skills框架,GitHub 14.4万星。它不写业务代码,但通过CLAUDE.md配置文件控制AI怎么开发。
几个核心能力:
- 强制TDD:先写测试再写代码,跳不过去
- Git分支隔离:每个任务必须创建feature branch
- Code Review流程:代码改动必须验证通过才允许commit
- 子Agent驱动:复杂任务拆分给多个Agent并行跑
# CLAUDE.md 中 Superpowers 典型配置 skills: - tdd # 测试驱动开发 - git-isolation # Git分支隔离 - code-review # 代码审查 - brainstorm # 方案设计先行 - debug-verify # 调试验证闭环
1.3 Hermes Agent:学习进化层
Nous Research开源的自进化AI Agent,MIT协议,两个月从0到4.7万星。
36氪/极客公园做了篇联合报道,里面有个判断我觉得挺准的:它不只是在用模型,还在不停生产可以反哺模型的训练数据。
学习闭环架构:
任务执行 → 技能提炼 → 持久记忆 → 训练数据导出
↑ ↓ ←——————— 下次任务复用 ←———————————————
跟OpenClaw对比一下:
2.1 Claude Code 单用的痛点
Claude Code干活是猛,但有个毛病——上来就改文件。
# 典型翻车场景 你: 帮我修复这个并发bug Claude Code: 好的! # 直接改了 main.go、handler.go、middleware.go 三个文件 # 没拉分支、没写测试、没跑验证 # 改完发现 middleware.go 的改动引入了新问题 # 要花半小时倒查是哪步出的问题
2.2 加上 Superpowers 后
# 同样的场景 你: 帮我修复这个并发bug Superpowers 约束下的 Claude Code: # Step 1: 创建 fix/concurrent-bug 分支 # Step 2: 先写复现用的测试用例 TestConcurrentBug() # Step 3: 跑测试确认能复现 # Step 4: 修改代码 # Step 5: 跑测试确认修复 # Step 6: 提交并创建 PR
稳多了。但问题是:下次遇到差不多的并发bug,它还是从头推理一遍。
2.3 再加上 Hermes Agent
# 两周后遇到另一个并发bug Hermes Agent: 检测到类似任务,找到已有Skill “go-concurrent-fix” # 直接调用上次总结的经验: # - 先 go vet -race 跑竞态检测 # - 定位到共享变量后用 sync.Mutex 或 channel 保护 # - 验证步骤:压测 100 并发 × 1000 请求 # API 调用从 25 次降到 8 次
3.1 环境准备
# 1. 安装 Claude Code npm install -g @anthropic-ai/claude-code
# 2. 安装 Superpowers cd your-project npx superpowers init
# 3. 安装 Hermes Agent curl -sSL https://hermes.nousresearch.com/install.sh | bash hermes init –model claude-opus-4.6
3.2 项目级配置文件
CLAUDE.md(Superpowers核心配置):
# Project: my-go-service
Skills
- tdd
- git-isolation
- code-review
- debug-verify
Conventions
- Language: Go 1.23
- Framework: tRPC-Go
- Test: go test with -race flag
- Lint: golangci-lint run
- Branch naming: feat/xxx, fix/xxx, refactor/xxx
Rules
- NEVER commit directly to main
- ALWAYS write test before implementation
- ALWAYS run
go vet ./...before commit - Max file changes per PR: 10
Hermes Agent 配置(.hermes/config.yaml):
model: claude-opus-4.6 memory: enabled: true retention_days: 90 auto_summarize: true skills: auto_generate: true min_complexity: 3 # 只有步骤>=3的任务才沉淀技能 review_before_save: false integrations: claude_code: true superpowers: true3.3 一个真实案例
需求:给现有Go微服务加gRPC健康检查端点。
# Step 1: Hermes Agent 接收任务、查记忆 $ hermes task “给 user-service 添加 gRPC 健康检查端点”
[Hermes] 搜索历史记忆... [Hermes] 找到相关 Skill: “grpc-health-check-go” (上次在 order-service 用过) [Hermes] 任务拆解: 1. 添加 health.proto 定义 2. 生成 Go 代码 3. 实现 HealthServer 4. 注册到 gRPC server 5. 添加单元测试 6. 集成测试验证
# Step 2: Superpowers 约束流程 [Superpowers] 创建分支 feat/grpc-health-check [Superpowers] 要求先写测试 TestHealthCheck()
# Step 3: Claude Code 执行编码 [Claude Code] 生成 health.proto... [Claude Code] 运行 protoc 生成 Go 代码... [Claude Code] 实现 HealthServer... [Claude Code] 编写测试... [Claude Code] 运行 go test -v -race ./... ✅ PASS
# Step 4: 验证 & 提交 [Superpowers] golangci-lint run ✅ [Superpowers] 创建 PR: feat/grpc-health-check → main
# Step 5: Hermes 沉淀经验 [Hermes] 更新 Skill “grpc-health-check-go”:
- 新增: user-service 的端口配置差异
- 优化: proto 文件路径改为相对路径
min_complexity: 3 过滤简单任务 Superpowers 过度约束 改一行注释也要拉分支跑测试 在 CLAUDE.md 加
skip_for: [“docs”, “comments”] Claude Code Token 消耗 大文件Review一次烧几万Token 配合
.claudeignore 排除 vendor/ 和生成代码 三者配置冲突 Hermes 和 Superpowers 同时控制 Git 操作 Hermes 管规划,Superpowers 管执行,config里明确分工 Hermes Skill 质量 自动生成的 Skill 有时步骤冗余 定期
hermes skills review 清理低质量技能
在一个中型Go微服务项目(约3万行代码)上跑的:
有个值得注意的点:加Superpowers后耗时反而多了2分钟(流程步骤变多),但引入bug率从15%掉到4%。再叠上Hermes,靠复用经验把耗时和API调用都拉下来了。
不同场景怎么选
几个要注意的事
- Hermes Agent 团队有Web3背景。之前做以太坊 MEV 基础设施,融资用代币计价。链上已经有了非官方的 NOUS 代币,跟项目没关系,别碰就行
- Token 成本不低。三件套叠起来消耗比较大,简单任务可以分流到本地模型
- 配置有学习曲线。三个工具各有一套配置文件,第一次调通大概花1-2小时
一句话
Claude Code 出活,Superpowers 不出事,Hermes Agent 越来越快。对我来说这是现阶段效率最高的组合。
- 36氪/极客公园:两个月4.7万星,爆火的Hermes Agent是下一个龙虾还是另一个故事?
- CSDN:2026年4月AI编程工具终极横评
- Hermes Agent 官方文档
- Superpowers GitHub 仓库
- Claude Code SWE-bench 评测报告
- 开源中国:hermes-agent单日狂揽6485星
你在用什么AI编程工具组合?踩过什么坑?欢迎评论区聊聊
觉得有用就 点赞 👍 收藏 ⭐ 关注专栏
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/257563.html