2026年HarnessDesign实践篇:ManagedAgents如何让AI原生应用开发提速10倍

HarnessDesign实践篇:ManagedAgents如何让AI原生应用开发提速10倍文章总结 Anthropic 发布的 ClaudeManage 通过 Meta Harness 架构将 AI 大脑 Claude 模型 与执行四肢 安全沙箱 解耦 提供生产级 Agent 基础设施 核心价值包括开箱可用的安全沙箱 长时间会话持久化和多 Agent 协作能力 使 AI 应用开发周期从数月缩短至数天 该方案解决了基础设施复杂性瓶颈 让开发者专注于业务逻辑而非运维负担

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



文章总结: Anthropic发布的ClaudeManagedAgents通过Meta-Harness架构将AI大脑(Claude模型)与执行四肢(安全沙箱)解耦,提供生产级Agent基础设施。核心价值包括开箱可用的安全沙箱、长时间会话持久化和多Agent协作能力,使AI应用开发周期从数月缩短至数天。该方案解决了基础设施复杂性瓶颈,让开发者专注于业务逻辑而非运维负担,目前已在实际案例中实现10倍效率提升。 综合评分: 87 文章分类: AI安全,云安全,应用安全,安全开发,解决方案


cover_image

原创

秀逗猫 秀逗猫

秀逗猫

2026年4月11日 13:25 北京

在小说阅读器读本章

去阅读

2026年4月8日,Anthropic 正式发布了 Claude Managed Agents,这是一套用于构建和部署云托管 AI Agent 的可组合 API。Managed Agents 将经过性能优化的 Agent Harness 与生产级基础设施结合,实现从原型到上线的周期从数月缩短至数天

文章的核心观点是:AI 应用开发的核心瓶颈不在于模型能力,而在于基础设施的复杂性。Managed Agents 通过解耦”大脑”与”四肢”,让开发者专注于用户体验,而非运维负担。

  1. 生产级 Agent – 安全沙箱、身份认证、工具执行等基础设施开箱即用
  2. 长时间会话 – 可自主运行数小时,断连后状态和输出依然持久
  3. 多 Agent 协作 – Agent 可启动并指挥其他 Agent 并行处理复杂任务

构建一个生产级 AI Agent,远不止”调用模型”那么简单。在模型能力之上,还需要:

| 必需组件 | 说明 | | — | — | | 沙箱隔离执行 | 安全运行不受信任的代码 | | 状态持久化 | 会话中断后能恢复执行 | | 凭证管理 | 安全访问外部系统 | | 权限控制 | 细粒度限制 Agent 操作范围 | | 端到端追踪 | 可观测性和调试能力 |

“光是这些基础设施工作,就需要数月的开发时间,才能交付用户真正看到的功能。”——Anthropic

讽刺的是,尽管 Claude 模型本身已经足够强大(能够自我评估、迭代优化、自主规划),但开发者的大部分精力却消耗在了”护城河”建设上:

  • 沙箱怎么搭?
  • 会话状态怎么管理?
  • 权限怎么精细化控制?

Managed Agents 的出现,正是为了将这些基础设施负担抽离,让开发者回归业务价值

Managed Agents 采用了 Meta-Harness(元工具架)设计模式:

“操作系统的成功在于将硬件虚拟化为足够通用的抽象,以容纳尚未被想到的程序。Managed Agents 的目标同样是为 Claude 设计足够通用的系统,以容纳未来的工具架、沙箱或其他组件。”

┌─────────────────────────────────────────────────────────┐ │                    Managed Agents                        │ ├─────────────────────────────────────────────────────────┤ │                                                         │ │   ┌─────────────┐      ┌─────────────┐                │ │   │    Brain     │      │    Hand     │                │ │   │   (大脑)     │ ←──→ │   (四肢)     │                │ │   │   Claude     │      │   Sandbox   │                │ │   └─────────────┘      └─────────────┘                │ │         │                    │                          │ │         ▼                    ▼                          │ │   ┌─────────────┐      ┌─────────────┐                │ │   │   Session   │      │   Tools     │                │ │   │   (会话)     │      │   (工具)     │                │ │   └─────────────┘      └─────────────┘                │ │                                                         │ └─────────────────────────────────────────────────────────┘ 

1. Brain(大脑)- Claude 本身

Claude 是整个系统的”大脑”,负责:

  • 决策制定
  • 任务规划
  • 自我评估与迭代
  • 状态管理

2. Hand(四肢)- Sandbox(沙箱)

“四肢”是 Claude 执行操作的载体,核心是安全沙箱

  • 解耦原则:大脑与四肢通过标准化接口通信
 execute(name, input) → string 
  • 灵活性:沙箱可以是容器、手机模拟器,甚至游戏模拟器
  • 工具无关:支持任何自定义工具、MCP 服务器

3. Session(会话)- 状态持久化

会话管理确保:

  • 长时间运行的稳定性
  • 断连后的状态恢复
  • 执行进度的持久化

| 之前 | 之后 | | — | — | | 单体架构,耦合严重 | 模块化,可独立演进 | | 容器故障导致全局失败 | 单点故障隔离 | | 难以横向扩展 | 大脑可分配给多个四肢 | | 工具与模型强绑定 | 工具通过标准化接口接入 |

补充接口(官方工程博客精确定义)

| 接口 | 用途 | 说明 | | — | — | — | | execute(name, input) → string | 大脑调用四肢 | 输入工具名和参数,返回执行结果 | | provision({resources}) | 故障重置容器 | 容器失败时自动重试 | | wake(sessionId) + getSession(id) | 恢复 harness | harness 崩溃后重启 | | getEvents() | 会话切片查询 | 支持 rewind / 局部读取 | | emitEvent(id, event) | 持久化记录 | 外部 append-only log |

额外收益:p50 TTFT 下降约 60%,p95 下降超 90%(因无需提前预置所有容器)。


当前产品处于 Public beta 阶段,所有 API 请求需携带 managed-agents-2026-04-01 beta header。部分特性(outcomes、multi-agent、memory)处于 research preview,需单独申请访问。

Managed Agents 支持 Self-Evaluation(自我评估):

  • 你定义outcomes(结果)和 success criteria(成功标准)
  • Claude 自己评估进度,不断迭代直到达成目标
  • 适用于需要反复优化的复杂任务

在 internal structured file generation 测试中,Managed Agents 相比标准提示循环的 outcome task success 提升高达 10 个百分点(在最难问题上收益最大)。

Model Context Protocol (MCP) 是 Anthropic 推出的标准化协议,用于:

  • 连接外部系统(CRM、日历、文档等)
  • 扩展 Agent 能力边界
  • 即插即用的工具生态

Managed Agents 原生支持 MCP 服务器,让 Claude 能够:

  • 动态编写工具来满足用户查询
  • 按需连接外部数据源
  • 无需预判所有可能的查询场景

多个 Agent 可以组成协作网络:

Agent A (规划者)     ↓ 分配任务 Agent B (执行者) ←→ Agent C (执行者)     ↓ 汇总结果 Agent A (协调者) 

适用场景

  • 复杂任务的并行处理
  • 专业领域的分工协作
  • 层次化的任务分解

“从单个容器的大脑到多个容器的大脑,最大的挑战是认知负载:决定把工作发送给谁——这比在单个 shell 中操作要难得多。”——Anthropic

Notion 将 Managed Agents 集成到工作空间,让团队可以直接委托任务给 Claude。

  • 工程师:用它来编写代码
  • 知识工作者:用它来生成网站和演示文稿
  • 效果:数十个任务可并行运行,整个团队协作产出

Rakuten 在产品、销售、市场和财务领域部署了企业 Agent,接入 Slack 和 Teams:

  • 员工分配任务,获得交付物(表格、幻灯片、应用)
  • 每个专业 Agent 在一周内完成部署

Vibecode 将 Managed Agents 作为默认集成方案:

  • 帮助用户从提示词直接部署应用
  • 上线速度比之前至少 10 倍

Sentry 将其调试 Agent(Seer)与 Claude Agent 结合:

  • Seer 发现问题 → Claude 编写补丁 → 自动打开 PR
  • 从发现 Bug 到可审查的修复,一条流程搞定
  • 集成上线周期:从数月缩短到数周

Asana 构建了 AI Teammates,让协作式 AI Agent 直接在 Asana 项目中与人类并行工作,承担任务并起草交付物。团队借助 Managed Agents 显著加快了高级功能的开发速度。

Meta-Harness 的核心思想是对接口固执己见,对实现保持中立

| 接口层(固定) | 实现层(灵活) | | — | — | | Claude 的决策能力 | 具体使用哪个模型 | | Session 状态管理 | 状态存储的方式 | | Sandbox 执行能力 | 沙箱的实现技术 | | 工具调用接口 | 具体的工具实现 |

Managed Agents 推荐的做法:

  • 优先使用通用工具:bash、编辑器等 Claude 熟悉的工具
  • MCP 扩展能力边界:通过标准化协议连接外部系统
  • 动态工具生成:让 Claude 按需编写工具

沙箱设计需要在严格隔离功能丰富之间取得平衡:

  • Read-only bash + 独立评估器(Claude Code 的模式)
  • 细粒度权限控制(scoped permissions)
  • 执行追踪与审计(execution tracing)

Managed Agents 的发布标志着 AI 应用开发进入”基础设施即服务”时代

| 开发者关注点 | Managed Agents 解决 | | — | — | | 业务逻辑 | ✅ 专注 | | 用户体验 | ✅ 专注 | | 基础设施 | ✅ 托管 | | 安全隔离 | ✅ 托管 | | 状态管理 | ✅ 托管 | | 可观测性 | ✅ 内置 |

  1. AI 应用的瓶颈转移:从”模型能力”转向”基础设施复杂性”
  2. Meta-Harness 范式:对 Claude 的接口固执己见,对实现保持中立
  3. 解耦是扩展性的关键:大脑与四肢分离,才能独立演进
  4. 自我评估是下一代 Agent 的标配:从”一次调用”到”持续迭代”

这一节是对 Anthropic 术语演进现象的分析,属于延伸讨论。

从 Harness Design 到 Managed Agents,我们观察到一个明显的趋势:Anthropic 在不断创造新的技术术语。这不是偶然,而是有意的品牌策略:

| 术语 | 官方首次出现 | 旧有概念 | 差异点 | | — | — | — | — | | Harness | 2026.03.24 | Agent Framework | 强调”驾驭”而非”使用” | | Context Reset | 2026.03.24 | Context Management | 强调”重置”策略 | | Skills | 2026.04.02 | Plugins / Extensions | 强调”技能”而非”工具” | | Memory Folder | 2026.04.02 | Context Management | 强调”持久化记忆” | | Compaction | 2026.04.02 | Context Compression | 强调”压缩”而非”截断” | | Meta-Harness | 2026.04.08 | Platform / Orchestration | 强调”元层级”的抽象 | | Managed Agents | 2026.04.08 | Agent as a Service | 强调”托管”服务模式 | | MCP | 2026.04.08 | Tool Protocol | Model Context Protocol |

造词的动机

  1. 概念差异化:在拥挤的 Agent 市场中建立独特认知
  2. 认知框架:每个新术语都带有一套隐含的设计理念
  3. 品牌资产:术语即护城河,其他厂商不能直接用

答案是两者兼有

真正的新概念

  • Meta-Harness 的”大脑-四肢”解耦,确实是架构上的创新
  • Self-Evaluation 让 Agent 自己判断成功与否,是范式转变
  • 长时间会话的持久化,确实需要新的基础设施支持

换汤不换药

  • “Managed Agents” ≈ Agent API + 托管基础设施
  • “Skills” ≈ MCP 协议封装的工具集
  • “Memory Folder” ≈ 结构化的上下文缓存
  1. 透过术语看本质:关注底层技术,而非营销词汇
  2. 保持术语敏感度:理解官方术语的精确含义,避免望文生义
  3. 拥抱演进,更新认知:每隔几个月就重新审视自己的知识体系

“不要被术语吓倒。Harness 就是一个 Agent 的外层代码,Managed Agents 就是帮你托管这个外层的服务。概念很简单,名字很复杂。”——一个务实的工程师

几乎可以肯定:会的

随着 Claude 能力的持续提升,Anthropic 必然会发明新术语来描述:

  • 更高级的自主性(可能叫 “Agentic Reasoning”?)
  • 更深度的记忆(可能叫 “Persistent Persona”?)
  • 更强的多模态协作(可能叫 “Synthesis”?)

建议:把 Anthropic 的每篇技术博客当作”术语预告片”来读,关注他们在描述什么新能力,而非纠结于他们用了什么新名字。

注:以下内容为解读作者基于官方资料延伸的分析与思考。

Managed Agents 的 Meta-Harness 模式,预示着 AI Agent 平台化的方向:

  • 平台提供基础设施(沙箱、会话、权限)
  • 开发者提供业务逻辑(Harness 的内容)
  • 模型厂商提供智能能力

MCP 协议的出现,意味着 Agent 工具生态正在走向标准化:

  • 工具可插拔
  • 系统可互操作
  • 能力可组合

未来的 Agent 可能会呈现多层次的自主性:

| 层级 | 自主程度 | 适用场景 | | — | — | — | | L1 | 辅助建议 | 用户主导的复杂决策 | | L2 | 自动执行 | 明确边界的重复任务 | | L3 | 自主规划 | 开放性的创新任务 | | L4 | 自我改进 | 持续优化的长期目标 |

Managed Agents 目前主要覆盖 L2-L3,但随着模型能力的提升,更高自主性层级将成为可能。

从这三篇文章来看,Anthropic 的术语迭代速度在加快:

| 时间 | 文章 | 新术语 | | — | — | — | | 2026.03.24 | Harness Design | Harness、Context Reset | | 2026.04.02 | Harnessing Claude’s Intelligence | Skills、Memory Folder、Compaction | | 2026.04.08 | Managed Agents | Meta-Harness、Managed Agents、MCP |

规律

  • 每篇文章都在引入 2-3 个核心新术语
  • 新术语往往是对旧概念的重新包装或真正扩展
  • 有些术语会”存活”(如 MCP),有些可能只是过渡(如某些特定模式名)

对开发者的建议

  • 跟进阅读:每篇官方博客都是术语预告
  • 保持怀疑:新词 ≠ 新概念,区分营销与技术创新
  • 聚焦本质:无论叫什么名字,关注它解决什么问题
  • 追踪 meta-harness:官方工程博客已明确使用 “meta-harness” 一词,建议开发者直接阅读原文以跟进最新接口变化

  • Claude Managed Agents 产品发布(https://claude.com/blog/claude-managed-agents)
  • Managed Agents 架构设计(https://www.anthropic.com/engineering/managed-agents)
  • Managed Agents 平台文档(https://platform.claude.com/docs/en/managed-agents/overview)


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:秀逗猫 秀逗猫

 秀逗猫《Harness Design实践篇:Managed Agents如何让AI原生应用开发提速10倍》

小讯
上一篇 2026-04-14 23:54
下一篇 2026-04-14 23:52

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/258315.html