
这两个月,Agent 圈里有个项目涨得很快,名字也很直白:OpenHarness。
很多人第一次看到它时,会下意识把它归到“又一个 Claude Code 替代品”或者“又一个 AI 编程壳子”那一类里。但真去看它的 README、变更记录和文档,会发现它想做的事情其实不太一样。
OpenHarness 更像是一套“Agent 骨架层”。
模型负责思考,Harness 负责把它变成一个真正能工作的 Agent——给它工具、记忆、上下文压缩、权限边界、任务循环、子代理和团队协作能力。项目 README 里对这个词解释得很直接:模型提供 intelligence,Harness 提供 hands、eyes、memory 和 safety boundaries。换句话说,OpenHarness 关心的不是“模型会不会答题”,而是“模型到底怎么在现实环境里把事做完”。
如果只看这一点,你就能理解它为什么会被很多开发者盯上。
因为今天大家真正缺的,往往已经不是“AI 会不会写代码”,而是:AI 一旦开始长期工作,靠什么稳住它、约束它、组织它。
先给一句尽量不绕的定义:
OpenHarness 是一个开源的 Python Agent Harness 实现,用来把大模型包成一个真正能执行任务的 Agent 运行时。
官方 GitHub 仓库把它描述成面向 researchers、builders 和 community 的开源实现,目标不是只做聊天,而是帮助大家理解生产级 AI Agent 的骨架、实验工具和协作模式,并在这套基础上扩展自己的插件、Provider 和领域知识。
这个定位其实很关键。
因为它说明 OpenHarness 不是单纯在卖一个“更漂亮的终端界面”,而是在把一套 Agent 基础设施开源化。它把很多原本藏在闭源产品或复杂运行时背后的东西,尽量摊开给你看。
从 README 和文档里能看出来,它现在的核心能力大致分成几层:
- Agent Loop:流式工具调用循环、重试、并行工具执行、token 与成本统计
- Harness Toolkit:43 个工具、按需加载的 Markdown skills、插件体系,以及对 anthropics/skills 与 plugins 布局的兼容
- Context & Memory:自动发现并注入
CLAUDE.md、自动压缩上下文、持久化MEMORY.md、会话恢复与历史 - Governance:多级权限模式、路径级与命令级规则、PreToolUse / PostToolUse hooks、交互式审批
- Swarm Coordination:子代理生成与委派、团队注册与任务管理、后台任务生命周期
如果你熟悉 Claude Code、Codex CLI、OpenHands 这一类工具,会很快意识到 OpenHarness 的野心不是只补一个点,而是想把“Agent 骨架”这件事拆成可组合的模块。
说它“突然火了”不是夸张。
到我写这篇时,仓库页面显示它已经有 8.6k stars、1.5k forks、223 次提交;而且项目的公开首个版本 v0.1.0 才在 2026 年 4 月 1 日 发布,几天后就迅速更到了 v0.1.6。这说明它还很新,但关注度已经明显超出一般早期项目。
我觉得它之所以会被盯上,原因大概有三个。
过去两年,很多人谈 Agent,重点放在模型本身。现在慢慢大家都反应过来了:真正决定一个 Agent 好不好用的,往往不只是模型,而是它外面那层 Harness。
上下文怎么压缩、工具怎么调用、权限怎么管、任务怎么恢复、长会话怎么续、并行代理怎么协作,这些问题全都不在“模型本体”里,而在 Harness 里。
OpenHarness 直接把这个概念抬到了台面上,所以它很容易让已经玩过一圈 Agent 的人产生共鸣。
项目作者在公开介绍里把它描述成一种“ultra-lightweight, pure Python”路线,这种气质在现在的 Agent 工具里很有辨识度。
很多人对 Agent 框架的直觉是:功能一多,就会变重、变复杂、变得像平台。OpenHarness 的有趣之处在于,它试图维持一种“够骨架、不过度平台化”的平衡——既有 CLI、TUI、插件、权限、子代理、MCP、后台任务这些骨架能力,又尽量不把自己做成一个很重的大平台。
这会让很多开发者感觉:它更像一套能摸得到、改得动、学得会的东西。
OpenHarness 里除了 oh,还有一个很醒目的内置个人 Agent:ohmo。
官方文档里写得很明确,ohmo 不是另一个普通聊天机器人,而是建立在 OpenHarness 上的 personal agent。它可以通过 Feishu、Slack、Telegram、Discord 这些渠道工作,并且复用你现有的 Claude 或 Codex 订阅,不一定需要额外 API key。
这件事很聪明。
因为它让 OpenHarness 不只是一套“给开发者研究 Agent 用的骨架”,而是顺手给了一个能拿来体验的落点。很多人一开始未必是为了研究 Harness 才点进来,可能只是想看看“这东西到底能不能直接跑起来”。而 ohmo 正好承担了这层入口。
OpenHarness 真正值得看,不在于它有多少个工具,而在于它在试图回答一个很现实的问题:
如果模型只是大脑,那一个真正能工作很久的 Agent,还需要什么身体和秩序?
这也是为什么我觉得它不该被简单理解成“又一个命令行 AI 工具”。
从 README 的结构就能看出来,项目几乎是按一套完整骨架来组织的:
- 工具不是零散功能,而是工具注册表和调用链的一部分
- 记忆不是聊天记录,而是会跨会话延续的
MEMORY.md - 上下文不是越堆越好,而是会自动 compact
- 权限不是一句“你小心点”,而是 path / command / mode 级规则
- 协作不是只靠 prompt,而是有子代理、团队注册、后台任务生命周期
这种思路背后,其实已经不是“我想让模型多会一点”,而是“我想把模型放进一个更像真实工程系统的运行环境里”。
这也是 OpenHarness 和很多“AI 编程工具”最容易被混淆、但实际上差别很大的地方。
这里得先泼一点冷水。
OpenHarness 值得试,但它并不是那种装上就一定让每个人都觉得更省心的工具。原因也很简单:它本质上是一套骨架层,而不是一个已经被打磨得特别平滑的闭源成品。
从 changelog 能看出来,它最近更新非常快:4 月 8 日、4 月 10 日都还在补 MCP HTTP transport、断线自动重连、权限弹窗串行化、Windows 问题、调试日志、Auto-Compaction、subprocess teammate 稳定性等细节。这一方面说明项目活跃,另一方面也说明它还处在快速演进期。
所以新手第一次接触它,最好先别把预期放成“像消费级产品一样丝滑”,而应该把它看成:
一套非常值得上手、但仍然在快速长骨头的开源 Agent 骨架。
如果你能接受这一点,体验会更真实。
我觉得最直接的区别是:它更强调“骨架层”而不是“品牌层”。
很多工具会把重点放在:
- 哪个模型更强
- 哪个 UI 更顺手
- 哪个订阅更划算
OpenHarness 则更像是在说:
- Agent Loop 怎么搭
- 工具怎么注册与调用
- 技能和插件怎么组合
- 上下文怎么压缩
- 权限怎么约束
- 子代理和后台任务怎么管理
所以如果你只是想找一个“替代聊天框”的工具,那它未必是最直接的选择;但如果你想理解一个真正能长期工作的 Agent 运行时大概长什么样,OpenHarness 反而很有学习价值。
如果是第一次上手,我建议按最短路径来,不要一开始就扑进多代理和插件生态。
官方 Quick Start 给的路径很清楚:
curl -fsSL https://raw.githubusercontent.com/HKUDS/OpenHarness/main/scripts/install.sh | bash # 或者 pip install openharness-ai
装完之后,不要自己猜配置,直接跑:
oh setup
这个交互向导会让你选择 Provider 和认证方式。README 里明确写了,它支持 Claude、、、Codex、Moonshot/Kimi、GLM、MiniMax 以及各种兼容端点;并且把 Provider 当成“workflow-backed profiles”来处理,而不是让你直接手搓一堆底层细节。
这一步对新手特别友好,因为你不用一开始就理解它内部所有 auth / provider 机制。
配置好以后,直接:
oh
这是最简单、也最适合第一次感受项目气质的方式。
你完全可以在一个自己的小仓库里先试这种任务:
先读这个仓库,找出你认为最容易出问题的一处逻辑,解释原因,修掉它,并运行相关测试。
官方 showcase 里给的 repo-aware coding assistant 示例,基本也是这个方向:阅读代码、修改文件、跑验证命令。对于第一次上手来说,这已经足够判断你喜不喜欢它的节奏。
如果前两步没问题,接下来最值得学的其实是 print mode。
文档里写得很清楚,OpenHarness 支持:
oh -p "Explain this codebase" oh -p "List all functions in main.py" --output-format json oh -p "Fix the bug" --output-format stream-json
这一步很重要,因为它决定了 OpenHarness 不只是“一个你盯着用的”,而是可以被塞进脚本、流水线和自动化任务里。对很多开发者来说,这反而是它真正开始变得有价值的时刻。
OpenHarness 现在已经把多代理和后台任务相关能力摆得很显眼了:子代理生成、团队注册、任务管理、后台任务生命周期,这些都已经出现在主 README 里。
但我真心不建议新手第一天就拿这些当主菜。原因很简单:骨架越完整,系统心智也越复杂。
先把单代理、本地仓库助手、print mode、权限模式、会话恢复跑顺,再去碰 swarm coordination,会更稳。
如果要说适合的人,我觉得主要有三类。
这类人不是只想“让 AI 干点活”,而是想弄懂:
- 为什么一个 Agent 会失控
- 为什么长会话会崩
- 为什么权限和 hooks 很重要
- 为什么工具、记忆、子代理会影响最终效果
对他们来说,OpenHarness 的价值不只是用,而是能拿来拆。
如果你已经有自己的 Provider、自己的插件想法,或者想搭一个领域 Agent,OpenHarness 这种“骨架清晰、组件化明显”的项目会比纯成品工具更有参考价值。
它这波更新里最值得注意的一个点,就是 Auto-Compaction:官方写得很直白,它会在上下文压缩时尽量保住任务状态和 channel 日志,让 Agent 可以跑 multi-day sessions,而不用手动 compact / clear。你会发现,这已经不是“问答助手”的思路,而是在认真处理长时间运行问题了。
同样要说实话。
如果你只是想偶尔问几个问题、改几行代码、体验一下 AI 写码,那 OpenHarness 不一定是最轻松的入口。因为它本身关心的是一整套 Harness,而不是把一切复杂性都藏起来。
还有一种人也不一定适合:你只想要一个已经极度成熟、几乎不需要理解内部机制的消费级工具。OpenHarness 现在更像是一个高潜力、强骨架、还在快速演进中的开源项目,而不是一个所有边角都磨圆了的成品平台。
我觉得 OpenHarness 最值得看的地方,不是它有没有 43 个工具,也不是它 stars 涨得多快,而是它在认真提醒大家一件事:
一个 Agent 真正难的地方,从来不只是“模型够不够聪明”,而是“你有没有给它一套能长期工作的骨架”。
OpenHarness 把这件事做成了一个开源、可运行、可拆解、可扩展的项目。这本身就很值得关注。
如果你已经开始对 Agent 的工具层、权限层、上下文层和协作层感兴趣,它非常值得亲手装一次;哪怕最后不长期用,它也能帮你把“Agent 到底靠什么跑起来”这件事看得更清楚。
- GitHub 仓库
- README
- CHANGELOG
- SHOWCASE
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/257415.html