OpenHarness 入门：一个开源 Agent 骨架，为什么突然火了

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

这两个月，Agent 圈里有个项目涨得很快，名字也很直白：OpenHarness。

很多人第一次看到它时，会下意识把它归到“又一个 Claude Code 替代品”或者“又一个 AI 编程壳子”那一类里。但真去看它的 README、变更记录和文档，会发现它想做的事情其实不太一样。

OpenHarness 更像是一套“Agent 骨架层”。

模型负责思考，Harness 负责把它变成一个真正能工作的 Agent——给它工具、记忆、上下文压缩、权限边界、任务循环、子代理和团队协作能力。项目 README 里对这个词解释得很直接：模型提供 intelligence，Harness 提供 hands、eyes、memory 和 safety boundaries。换句话说，OpenHarness 关心的不是“模型会不会答题”，而是“模型到底怎么在现实环境里把事做完”。

如果只看这一点，你就能理解它为什么会被很多开发者盯上。

因为今天大家真正缺的，往往已经不是“AI 会不会写代码”，而是：AI 一旦开始长期工作，靠什么稳住它、约束它、组织它。

先给一句尽量不绕的定义：

OpenHarness 是一个开源的 Python Agent Harness 实现，用来把大模型包成一个真正能执行任务的 Agent 运行时。

官方 GitHub 仓库把它描述成面向 researchers、builders 和 community 的开源实现，目标不是只做聊天，而是帮助大家理解生产级 AI Agent 的骨架、实验工具和协作模式，并在这套基础上扩展自己的插件、Provider 和领域知识。

这个定位其实很关键。

因为它说明 OpenHarness 不是单纯在卖一个“更漂亮的终端界面”，而是在把一套 Agent 基础设施开源化。它把很多原本藏在闭源产品或复杂运行时背后的东西，尽量摊开给你看。

从 README 和文档里能看出来，它现在的核心能力大致分成几层：

Agent Loop：流式工具调用循环、重试、并行工具执行、token 与成本统计
Harness Toolkit：43 个工具、按需加载的 Markdown skills、插件体系，以及对 anthropics/skills 与 plugins 布局的兼容
Context & Memory：自动发现并注入 CLAUDE.md、自动压缩上下文、持久化 MEMORY.md、会话恢复与历史
Governance：多级权限模式、路径级与命令级规则、PreToolUse / PostToolUse hooks、交互式审批
Swarm Coordination：子代理生成与委派、团队注册与任务管理、后台任务生命周期

如果你熟悉 Claude Code、Codex CLI、OpenHands 这一类工具，会很快意识到 OpenHarness 的野心不是只补一个点，而是想把“Agent 骨架”这件事拆成可组合的模块。

说它“突然火了”不是夸张。

到我写这篇时，仓库页面显示它已经有 8.6k stars、1.5k forks、223 次提交；而且项目的公开首个版本 v0.1.0 才在 2026 年 4 月 1 日 发布，几天后就迅速更到了 v0.1.6。这说明它还很新，但关注度已经明显超出一般早期项目。

我觉得它之所以会被盯上，原因大概有三个。

过去两年，很多人谈 Agent，重点放在模型本身。现在慢慢大家都反应过来了：真正决定一个 Agent 好不好用的，往往不只是模型，而是它外面那层 Harness。

上下文怎么压缩、工具怎么调用、权限怎么管、任务怎么恢复、长会话怎么续、并行代理怎么协作，这些问题全都不在“模型本体”里，而在 Harness 里。

OpenHarness 直接把这个概念抬到了台面上，所以它很容易让已经玩过一圈 Agent 的人产生共鸣。

项目作者在公开介绍里把它描述成一种“ultra-lightweight, pure Python”路线，这种气质在现在的 Agent 工具里很有辨识度。

很多人对 Agent 框架的直觉是：功能一多，就会变重、变复杂、变得像平台。OpenHarness 的有趣之处在于，它试图维持一种“够骨架、不过度平台化”的平衡——既有 CLI、TUI、插件、权限、子代理、MCP、后台任务这些骨架能力，又尽量不把自己做成一个很重的大平台。

这会让很多开发者感觉：它更像一套能摸得到、改得动、学得会的东西。

OpenHarness 里除了 oh，还有一个很醒目的内置个人 Agent：ohmo。

官方文档里写得很明确，ohmo 不是另一个普通聊天机器人，而是建立在 OpenHarness 上的 personal agent。它可以通过 Feishu、Slack、Telegram、Discord 这些渠道工作，并且复用你现有的 Claude 或 Codex 订阅，不一定需要额外 API key。

这件事很聪明。

因为它让 OpenHarness 不只是一套“给开发者研究 Agent 用的骨架”，而是顺手给了一个能拿来体验的落点。很多人一开始未必是为了研究 Harness 才点进来，可能只是想看看“这东西到底能不能直接跑起来”。而 ohmo 正好承担了这层入口。

OpenHarness 真正值得看，不在于它有多少个工具，而在于它在试图回答一个很现实的问题：

如果模型只是大脑，那一个真正能工作很久的 Agent，还需要什么身体和秩序？

这也是为什么我觉得它不该被简单理解成“又一个命令行 AI 工具”。

从 README 的结构就能看出来，项目几乎是按一套完整骨架来组织的：

工具不是零散功能，而是工具注册表和调用链的一部分
记忆不是聊天记录，而是会跨会话延续的 MEMORY.md
上下文不是越堆越好，而是会自动 compact
权限不是一句“你小心点”，而是 path / command / mode 级规则
协作不是只靠 prompt，而是有子代理、团队注册、后台任务生命周期

这种思路背后，其实已经不是“我想让模型多会一点”，而是“我想把模型放进一个更像真实工程系统的运行环境里”。

这也是 OpenHarness 和很多“AI 编程工具”最容易被混淆、但实际上差别很大的地方。

这里得先泼一点冷水。

OpenHarness 值得试，但它并不是那种装上就一定让每个人都觉得更省心的工具。原因也很简单：它本质上是一套骨架层，而不是一个已经被打磨得特别平滑的闭源成品。

从 changelog 能看出来，它最近更新非常快：4 月 8 日、4 月 10 日都还在补 MCP HTTP transport、断线自动重连、权限弹窗串行化、Windows 问题、调试日志、Auto-Compaction、subprocess teammate 稳定性等细节。这一方面说明项目活跃，另一方面也说明它还处在快速演进期。

所以新手第一次接触它，最好先别把预期放成“像消费级产品一样丝滑”，而应该把它看成：

一套非常值得上手、但仍然在快速长骨头的开源 Agent 骨架。

如果你能接受这一点，体验会更真实。

我觉得最直接的区别是：它更强调“骨架层”而不是“品牌层”。

很多工具会把重点放在：

哪个模型更强
哪个 UI 更顺手
哪个订阅更划算

OpenHarness 则更像是在说：

Agent Loop 怎么搭
工具怎么注册与调用
技能和插件怎么组合
上下文怎么压缩
权限怎么约束
子代理和后台任务怎么管理

所以如果你只是想找一个“替代聊天框”的工具，那它未必是最直接的选择；但如果你想理解一个真正能长期工作的 Agent 运行时大概长什么样，OpenHarness 反而很有学习价值。

如果是第一次上手，我建议按最短路径来，不要一开始就扑进多代理和插件生态。

官方 Quick Start 给的路径很清楚：

curl -fsSL https://raw.githubusercontent.com/HKUDS/OpenHarness/main/scripts/install.sh | bash # 或者 pip install openharness-ai

装完之后，不要自己猜配置，直接跑：

oh setup

这个交互向导会让你选择 Provider 和认证方式。README 里明确写了，它支持 Claude、、、Codex、Moonshot/Kimi、GLM、MiniMax 以及各种兼容端点；并且把 Provider 当成“workflow-backed profiles”来处理，而不是让你直接手搓一堆底层细节。

这一步对新手特别友好，因为你不用一开始就理解它内部所有 auth / provider 机制。

配置好以后，直接：

oh

这是最简单、也最适合第一次感受项目气质的方式。

你完全可以在一个自己的小仓库里先试这种任务：

先读这个仓库，找出你认为最容易出问题的一处逻辑，解释原因，修掉它，并运行相关测试。

官方 showcase 里给的 repo-aware coding assistant 示例，基本也是这个方向：阅读代码、修改文件、跑验证命令。对于第一次上手来说，这已经足够判断你喜不喜欢它的节奏。

如果前两步没问题，接下来最值得学的其实是 print mode。

文档里写得很清楚，OpenHarness 支持：

oh -p "Explain this codebase" oh -p "List all functions in main.py" --output-format json oh -p "Fix the bug" --output-format stream-json

这一步很重要，因为它决定了 OpenHarness 不只是“一个你盯着用的”，而是可以被塞进脚本、流水线和自动化任务里。对很多开发者来说，这反而是它真正开始变得有价值的时刻。

OpenHarness 现在已经把多代理和后台任务相关能力摆得很显眼了：子代理生成、团队注册、任务管理、后台任务生命周期，这些都已经出现在主 README 里。

但我真心不建议新手第一天就拿这些当主菜。原因很简单：骨架越完整，系统心智也越复杂。

先把单代理、本地仓库助手、print mode、权限模式、会话恢复跑顺，再去碰 swarm coordination，会更稳。

如果要说适合的人，我觉得主要有三类。

这类人不是只想“让 AI 干点活”，而是想弄懂：

为什么一个 Agent 会失控
为什么长会话会崩
为什么权限和 hooks 很重要
为什么工具、记忆、子代理会影响最终效果

对他们来说，OpenHarness 的价值不只是用，而是能拿来拆。

如果你已经有自己的 Provider、自己的插件想法，或者想搭一个领域 Agent，OpenHarness 这种“骨架清晰、组件化明显”的项目会比纯成品工具更有参考价值。

它这波更新里最值得注意的一个点，就是 Auto-Compaction：官方写得很直白，它会在上下文压缩时尽量保住任务状态和 channel 日志，让 Agent 可以跑 multi-day sessions，而不用手动 compact / clear。你会发现，这已经不是“问答助手”的思路，而是在认真处理长时间运行问题了。

同样要说实话。

如果你只是想偶尔问几个问题、改几行代码、体验一下 AI 写码，那 OpenHarness 不一定是最轻松的入口。因为它本身关心的是一整套 Harness，而不是把一切复杂性都藏起来。

还有一种人也不一定适合：你只想要一个已经极度成熟、几乎不需要理解内部机制的消费级工具。OpenHarness 现在更像是一个高潜力、强骨架、还在快速演进中的开源项目，而不是一个所有边角都磨圆了的成品平台。

我觉得 OpenHarness 最值得看的地方，不是它有没有 43 个工具，也不是它 stars 涨得多快，而是它在认真提醒大家一件事：

一个 Agent 真正难的地方，从来不只是“模型够不够聪明”，而是“你有没有给它一套能长期工作的骨架”。

OpenHarness 把这件事做成了一个开源、可运行、可拆解、可扩展的项目。这本身就很值得关注。

如果你已经开始对 Agent 的工具层、权限层、上下文层和协作层感兴趣，它非常值得亲手装一次；哪怕最后不长期用，它也能帮你把“Agent 到底靠什么跑起来”这件事看得更清楚。

GitHub 仓库
README
CHANGELOG
SHOWCASE

OpenHarness 入门：一个开源 Agent 骨架，为什么突然火了

相关推荐