OpenAI 用 Harness Engineering 让 Codex 写出了百万行零人工代码;Nous Research 的 Hermes Agent 凭借自进化学习环路两个月拿下 6.4 万 Star;而 OpenClaw 在爆火的同时也暴露了 82 个安全漏洞。当 Agent 从「代码助手」进化为「全权执行者」,一个核心问题浮出水面——你的 Agent 应该跑在谁的机器上? 本文梳理 2026 年 Agent 技术三大前沿趋势,并介绍一种正在成型的新范式:预装 OpenClaw 的本地智能终端。
如果你在过去三个月关注过 GitHub Trending,你一定注意到了三件事情的同时发生:
暗流一:Harness Engineering 的兴起——”模型不是难题,工程才是”
2026 年 2 月,OpenAI 发表了一篇影响深远的工程博文《Harness Engineering》。他们披露 Codex 团队构建了一个超过 100 万行代码的生产应用,其中没有一行是人类手写的。工程师的工作不再是写代码,而是设计让 AI 可靠地写代码的约束环境、反馈回路和执行护栏——这套系统被称为 Harness(缰绳系统)。
Martin Fowler 随后在 Thoughtworks 的技术雷达中将 Harness Engineering 定义为 2026 年最值得关注的工程实践之一:
Agent = Model + Harness。模型负责推理,Harness 负责让推理可靠。
Red Hat 的工程团队也分享了他们的实践经验:结构化的上下文输入比自由格式的需求描述,能让 Agent 输出的一致性提升数个量级。Anthropic 则设计了一套三 Agent 协同 Harness(规划 Agent + 生成 Agent + 评估 Agent),让 AI 在多小时的自主编码会话中保持连贯性。
这对开发者意味着什么? Agent 的能力上限不再取决于你用了哪个模型,而取决于你给它构建了怎样的运行环境。而环境的核心要素——工具链、记忆系统、权限边界、安全护栏——天然适合在本地可控环境中实现。
暗流二:Hermes Agent 的爆发——”Agent 应该越用越聪明”
2026 年 2 月 25 日,Nous Research 发布了 Hermes Agent v0.1.0。两个月后的 4 月 8 日,它已经迭代到 v0.8.0,合并了 209 个 PR,GitHub Star 突破 8.5 万。
Hermes Agent 的核心卖点不是又一个 Agent 框架,而是内置学习环路(Learning Loop):
- 持久记忆:跨会话保持对用户项目、偏好和上下文的认知,基于 SQLite + FTS5 全文检索
- 自动技能创建:当 Hermes 解决了一个复杂问题,它会自动将解法写成可复用的 Skill 文档
- 自优化:v0.8.0 最亮眼的 PR 之一是”自动化行为基准测试驱动的 GPT/Codex 工具调用优化”——Agent 自己发现自己的盲区,然后自己修补
Reddit、X 上到处都是”我从 OpenClaw 迁移到 Hermes”的帖子。Hermes 甚至内置了 hermes claw migrate 命令来平滑迁移 OpenClaw 的配置、记忆、技能和密钥。
值得注意的是,Hermes Agent 的设计哲学与 Harness Engineering 高度共鸣——它强调的不是模型能力,而是运行环境的持久性、可学习性和可控性。一个 $5/月的 VPS 就能跑,MIT 协议完全开源,支持 200+ 模型。
暗流三:OpenClaw 的安全危机——”高权限 Agent 的信任成本”
OpenClaw 在 2026 年初创下了 GitHub 增长纪录(Star 突破 31.5 万),但安全问题同样触目惊心:
安全内参数据显示:截至 2026 年 3 月,CNNVD 共收录 OpenClaw 漏洞 82 个,其中超危 12 个、高危 21 个。SecurityScorecard 探测到超过 46.9 万个公网暴露实例,其中 27.2% 存在已知高危漏洞。ClawHub 技能市场曾有约 20% 的插件被标记为恶意或可疑。
Cisco 的安全研究员将 OpenClaw 称为”security nightmare”——在分析的 31,000 个 Agent Skills 中,26% 至少包含一个安全漏洞。
问题的根源不在 OpenClaw 本身,而在于 Agent 的本质:AI Agent 不是聊天机器人,它拥有推理能力、工具调用能力和自动执行能力。一旦某一步被攻破,攻击者获得的不是一句错误回复,而是一条可以持续扩大的行动链。
把这三件事放在一起看,一条清晰的逻辑链条浮现出来:
- Harness Engineering 证明了:Agent 的可靠性取决于运行环境的工程质量,而不仅仅是模型能力
- Hermes Agent 证明了:持久记忆 + 自进化 + 本地部署 + 用户可控,是 Agent 的正确进化方向
- OpenClaw 安全事件证明了:高权限 Agent 在缺乏产品化安全防护的情况下,裸跑是危险的
三条线索指向同一个结论:Agent 需要一个安全、持久、用户可控的本地运行环境。
但这个结论对普通用户(甚至大部分开发者)来说,执行起来有巨大的门槛:
- 你需要一台合适的硬件(ARM/x86 + NPU 算力 + 足够存储)
- 你需要配置操作系统、Docker、网络、安全策略
- 你需要部署 OpenClaw 或 Hermes 并持续跟进安全补丁
- 你需要管理技能插件的供应链安全
有没有一种方案,把上面这些全部产品化?
有意思的是,端脑科技(Cephalon)率先给出了解法。端脑在 2026 年 3 月的新品发布会上给出了一个完整的产品矩阵:
硬件层
脑花 AI NPC——本地智能中枢
- 四核 Cortex-A76 处理器 + 800MHz VideoCore V1 GPU
- 支持 126 TOPS AI 算力(NPU)
- 4GB LPDDR4X 内存,microSD 扩展存储
- micro HDMI 输出(支持 4K60)
- 千兆以太网 + 双频 Wi-Fi + 蓝牙 5.0
- 预装 OpenClaw + Lucy AI OS
龙虾派——入门级本地智能小主机
- ¥1499 起,预装 OpenClaw
- 开箱即用,免安装、免配置
- 核心卖点:零门槛体验本地 AI Agent
软件层
Lucy AI OS——不是传统 OS,而是智能体引擎
- 管理 OpenClaw 技能的调度、运行和安全隔离
- 类比:如果 OpenClaw 是应用,Lucy AI OS 就是它的 Harness
- 与传统 OS(iOS/Windows/HarmonyOS)的区别在于,它的核心调度对象是 Agent 技能而非传统应用
Lucy APP——手机端控制入口
- 手机下达任务 → 设备本地执行 → 结果回传/归档
- 实现了「随身采、本地算、安全存」的闭环
Skill Map——安全审核的技能生态
- 所有上架技能经过安全审核
- 对标 ClawHub,但增加了供应链安全层
- 开发者可以提交技能并获得分发与变现
安全层
这是端脑产品矩阵中我认为最值得技术社区关注的部分:
- 端侧优先数据处理:核心计算在本地完成,敏感数据不出设备
- 技能审核机制:端脑云升级为 OpenClaw 安全技能库,所有技能通过安全审核后才能上架
- ZKP(零知识证明)协议:在不暴露原始数据的前提下完成身份验证和数据交互
从 Harness Engineering 的视角来看,端脑实际上做了一件事:把 Agent 的 Harness 从开发者自行搭建,变成了出厂预装。 这恰好回应了 OpenAI 在博文中反复强调的观点——Agent 能力的天花板,取决于它运行环境的工程质量。
如果你是一个关注 Agent 生态的开发者,端脑的产品矩阵提供了几个值得思考的方向:
1. Skill 开发者的新分发渠道
端脑的 Skill Map 本质上是一个有安全审核的 Agent 技能市场。如果你正在为 OpenClaw 或 Hermes 开发技能,多一个分发渠道意味着多一个变现可能。而且由于 Skill Map 内置了审核机制,通过审核的技能天然具备”安全可信”的标签——这在 ClawHub 恶意插件事件之后,对用户的吸引力是显而易见的。
2. Harness Engineering 的硬件化实践
端脑做的事情,可以理解为将 Harness Engineering 的**实践固化到硬件产品中。如果你认同”Agent = Model + Harness”的公式,那么端脑提供的就是一个出厂级 Harness——预配置的安全策略、预集成的技能运行时、预设的权限边界。
这不是要取代你自建 Agent 环境的自由度,而是为那些没有运维能力但有 Agent 需求的用户提供了一个可靠的起点。
3. 云边端协同的架构探索
端脑的技术架构不是纯本地——它设计了一套「云上有平台,桌上有终端,手机上有入口」的协同体系:
- 简单任务:本地处理(转写、归档、检索、自动化)
- 复杂推理:可选择走云端模型
- 敏感数据:永远不离开本地
这种架构思路与 Hermes Agent 强调的”自托管 + 多模型支持”哲学是一致的,但端脑把它做成了对非技术用户友好的产品形态。
2026 年的 AI Agent 赛道正在经历一次深刻的分化:
- 一侧是云端——模型更大、能力更强、生态更丰富,但数据控制权在平台手里
- 一侧是本地——算力有限、生态尚早,但数据主权在用户手里
Harness Engineering 告诉我们,Agent 的可靠性不在于模型,而在于运行环境的工程质量。Hermes Agent 告诉我们,Agent 的终极形态是”越用越聪明的长期伴侣”。OpenClaw 的安全事件告诉我们,高权限 Agent 不能裸奔。
端脑科技正在尝试的,是在这三者之间找到一个交汇点——把经过安全加固的 Agent 运行环境,做成普通人买得起、用得上的硬件产品。
这不是云端 vs 本地的对立,而是给用户多了一个选择:
你的 Agent,可以跑在你自己的桌上。
📎 相关资源
- 端脑科技官网:cephalon.cloud
- OpenClaw GitHub:github.com/openclaw/openclaw
- Hermes Agent GitHub:github.com/NousResearch/hermes-agent
- OpenAI Harness Engineering 博文:openai.com/index/harness-engineering
- Martin Fowler Harness Engineering 文章:martinfowler.com/articles/harness-engineering
- OpenClaw 安全漏洞分析(安全内参):secrss.com/articles/88371
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/267838.html