文章总结: Anthropic发布的ClaudeManagedAgents通过Meta-Harness架构将AI大脑(Claude模型)与执行四肢(安全沙箱)解耦,提供生产级Agent基础设施。核心价值包括开箱可用的安全沙箱、长时间会话持久化和多Agent协作能力,使AI应用开发周期从数月缩短至数天。该方案解决了基础设施复杂性瓶颈,让开发者专注于业务逻辑而非运维负担,目前已在实际案例中实现10倍效率提升。 综合评分: 87 文章分类: AI安全,云安全,应用安全,安全开发,解决方案

原创
秀逗猫 秀逗猫
秀逗猫
2026年4月11日 13:25 北京
在小说阅读器读本章
去阅读
2026年4月8日,Anthropic 正式发布了 Claude Managed Agents,这是一套用于构建和部署云托管 AI Agent 的可组合 API。Managed Agents 将经过性能优化的 Agent Harness 与生产级基础设施结合,实现从原型到上线的周期从数月缩短至数天。
文章的核心观点是:AI 应用开发的核心瓶颈不在于模型能力,而在于基础设施的复杂性。Managed Agents 通过解耦”大脑”与”四肢”,让开发者专注于用户体验,而非运维负担。
- 生产级 Agent – 安全沙箱、身份认证、工具执行等基础设施开箱即用
- 长时间会话 – 可自主运行数小时,断连后状态和输出依然持久
- 多 Agent 协作 – Agent 可启动并指挥其他 Agent 并行处理复杂任务
构建一个生产级 AI Agent,远不止”调用模型”那么简单。在模型能力之上,还需要:
| 必需组件 | 说明 | | — | — | | 沙箱隔离执行 | 安全运行不受信任的代码 | | 状态持久化 | 会话中断后能恢复执行 | | 凭证管理 | 安全访问外部系统 | | 权限控制 | 细粒度限制 Agent 操作范围 | | 端到端追踪 | 可观测性和调试能力 |
“光是这些基础设施工作,就需要数月的开发时间,才能交付用户真正看到的功能。”——Anthropic
讽刺的是,尽管 Claude 模型本身已经足够强大(能够自我评估、迭代优化、自主规划),但开发者的大部分精力却消耗在了”护城河”建设上:
- 沙箱怎么搭?
- 会话状态怎么管理?
- 权限怎么精细化控制?
Managed Agents 的出现,正是为了将这些基础设施负担抽离,让开发者回归业务价值。
Managed Agents 采用了 Meta-Harness(元工具架)设计模式:
“操作系统的成功在于将硬件虚拟化为足够通用的抽象,以容纳尚未被想到的程序。Managed Agents 的目标同样是为 Claude 设计足够通用的系统,以容纳未来的工具架、沙箱或其他组件。”
┌─────────────────────────────────────────────────────────┐ │ Managed Agents │ ├─────────────────────────────────────────────────────────┤ │ │ │ ┌─────────────┐ ┌─────────────┐ │ │ │ Brain │ │ Hand │ │ │ │ (大脑) │ ←──→ │ (四肢) │ │ │ │ Claude │ │ Sandbox │ │ │ └─────────────┘ └─────────────┘ │ │ │ │ │ │ ▼ ▼ │ │ ┌─────────────┐ ┌─────────────┐ │ │ │ Session │ │ Tools │ │ │ │ (会话) │ │ (工具) │ │ │ └─────────────┘ └─────────────┘ │ │ │ └─────────────────────────────────────────────────────────┘
1. Brain(大脑)- Claude 本身
Claude 是整个系统的”大脑”,负责:
- 决策制定
- 任务规划
- 自我评估与迭代
- 状态管理
2. Hand(四肢)- Sandbox(沙箱)
“四肢”是 Claude 执行操作的载体,核心是安全沙箱:
- 解耦原则:大脑与四肢通过标准化接口通信
execute(name, input) → string
- 灵活性:沙箱可以是容器、手机模拟器,甚至游戏模拟器
- 工具无关:支持任何自定义工具、MCP 服务器
3. Session(会话)- 状态持久化
会话管理确保:
- 长时间运行的稳定性
- 断连后的状态恢复
- 执行进度的持久化
| 之前 | 之后 | | — | — | | 单体架构,耦合严重 | 模块化,可独立演进 | | 容器故障导致全局失败 | 单点故障隔离 | | 难以横向扩展 | 大脑可分配给多个四肢 | | 工具与模型强绑定 | 工具通过标准化接口接入 |
补充接口(官方工程博客精确定义)
| 接口 | 用途 | 说明 | | — | — | — | | execute(name, input) → string | 大脑调用四肢 | 输入工具名和参数,返回执行结果 | | provision({resources}) | 故障重置容器 | 容器失败时自动重试 | | wake(sessionId) + getSession(id) | 恢复 harness | harness 崩溃后重启 | | getEvents() | 会话切片查询 | 支持 rewind / 局部读取 | | emitEvent(id, event) | 持久化记录 | 外部 append-only log |
额外收益:p50 TTFT 下降约 60%,p95 下降超 90%(因无需提前预置所有容器)。
当前产品处于 Public beta 阶段,所有 API 请求需携带
managed-agents-2026-04-01beta header。部分特性(outcomes、multi-agent、memory)处于 research preview,需单独申请访问。
Managed Agents 支持 Self-Evaluation(自我评估):
- 你定义outcomes(结果)和 success criteria(成功标准)
- Claude 自己评估进度,不断迭代直到达成目标
- 适用于需要反复优化的复杂任务
在 internal structured file generation 测试中,Managed Agents 相比标准提示循环的 outcome task success 提升高达 10 个百分点(在最难问题上收益最大)。
Model Context Protocol (MCP) 是 Anthropic 推出的标准化协议,用于:
- 连接外部系统(CRM、日历、文档等)
- 扩展 Agent 能力边界
- 即插即用的工具生态
Managed Agents 原生支持 MCP 服务器,让 Claude 能够:
- 动态编写工具来满足用户查询
- 按需连接外部数据源
- 无需预判所有可能的查询场景
多个 Agent 可以组成协作网络:
Agent A (规划者) ↓ 分配任务 Agent B (执行者) ←→ Agent C (执行者) ↓ 汇总结果 Agent A (协调者)
适用场景:
- 复杂任务的并行处理
- 专业领域的分工协作
- 层次化的任务分解
“从单个容器的大脑到多个容器的大脑,最大的挑战是认知负载:决定把工作发送给谁——这比在单个 shell 中操作要难得多。”——Anthropic
Notion 将 Managed Agents 集成到工作空间,让团队可以直接委托任务给 Claude。
- 工程师:用它来编写代码
- 知识工作者:用它来生成网站和演示文稿
- 效果:数十个任务可并行运行,整个团队协作产出
Rakuten 在产品、销售、市场和财务领域部署了企业 Agent,接入 Slack 和 Teams:
- 员工分配任务,获得交付物(表格、幻灯片、应用)
- 每个专业 Agent 在一周内完成部署
Vibecode 将 Managed Agents 作为默认集成方案:
- 帮助用户从提示词直接部署应用
- 上线速度比之前至少 10 倍
Sentry 将其调试 Agent(Seer)与 Claude Agent 结合:
- Seer 发现问题 → Claude 编写补丁 → 自动打开 PR
- 从发现 Bug 到可审查的修复,一条流程搞定
- 集成上线周期:从数月缩短到数周
Asana 构建了 AI Teammates,让协作式 AI Agent 直接在 Asana 项目中与人类并行工作,承担任务并起草交付物。团队借助 Managed Agents 显著加快了高级功能的开发速度。
Meta-Harness 的核心思想是对接口固执己见,对实现保持中立:
| 接口层(固定) | 实现层(灵活) | | — | — | | Claude 的决策能力 | 具体使用哪个模型 | | Session 状态管理 | 状态存储的方式 | | Sandbox 执行能力 | 沙箱的实现技术 | | 工具调用接口 | 具体的工具实现 |
Managed Agents 推荐的做法:
- 优先使用通用工具:bash、编辑器等 Claude 熟悉的工具
- MCP 扩展能力边界:通过标准化协议连接外部系统
- 动态工具生成:让 Claude 按需编写工具
沙箱设计需要在严格隔离与功能丰富之间取得平衡:
- Read-only bash + 独立评估器(Claude Code 的模式)
- 细粒度权限控制(scoped permissions)
- 执行追踪与审计(execution tracing)
Managed Agents 的发布标志着 AI 应用开发进入”基础设施即服务”时代:
| 开发者关注点 | Managed Agents 解决 | | — | — | | 业务逻辑 | ✅ 专注 | | 用户体验 | ✅ 专注 | | 基础设施 | ✅ 托管 | | 安全隔离 | ✅ 托管 | | 状态管理 | ✅ 托管 | | 可观测性 | ✅ 内置 |
- AI 应用的瓶颈转移:从”模型能力”转向”基础设施复杂性”
- Meta-Harness 范式:对 Claude 的接口固执己见,对实现保持中立
- 解耦是扩展性的关键:大脑与四肢分离,才能独立演进
- 自我评估是下一代 Agent 的标配:从”一次调用”到”持续迭代”
这一节是对 Anthropic 术语演进现象的分析,属于延伸讨论。
从 Harness Design 到 Managed Agents,我们观察到一个明显的趋势:Anthropic 在不断创造新的技术术语。这不是偶然,而是有意的品牌策略:
| 术语 | 官方首次出现 | 旧有概念 | 差异点 | | — | — | — | — | | Harness | 2026.03.24 | Agent Framework | 强调”驾驭”而非”使用” | | Context Reset | 2026.03.24 | Context Management | 强调”重置”策略 | | Skills | 2026.04.02 | Plugins / Extensions | 强调”技能”而非”工具” | | Memory Folder | 2026.04.02 | Context Management | 强调”持久化记忆” | | Compaction | 2026.04.02 | Context Compression | 强调”压缩”而非”截断” | | Meta-Harness | 2026.04.08 | Platform / Orchestration | 强调”元层级”的抽象 | | Managed Agents | 2026.04.08 | Agent as a Service | 强调”托管”服务模式 | | MCP | 2026.04.08 | Tool Protocol | Model Context Protocol |
造词的动机:
- 概念差异化:在拥挤的 Agent 市场中建立独特认知
- 认知框架:每个新术语都带有一套隐含的设计理念
- 品牌资产:术语即护城河,其他厂商不能直接用
答案是两者兼有:
真正的新概念:
- Meta-Harness 的”大脑-四肢”解耦,确实是架构上的创新
- Self-Evaluation 让 Agent 自己判断成功与否,是范式转变
- 长时间会话的持久化,确实需要新的基础设施支持
换汤不换药:
- “Managed Agents” ≈ Agent API + 托管基础设施
- “Skills” ≈ MCP 协议封装的工具集
- “Memory Folder” ≈ 结构化的上下文缓存
- 透过术语看本质:关注底层技术,而非营销词汇
- 保持术语敏感度:理解官方术语的精确含义,避免望文生义
- 拥抱演进,更新认知:每隔几个月就重新审视自己的知识体系
“不要被术语吓倒。Harness 就是一个 Agent 的外层代码,Managed Agents 就是帮你托管这个外层的服务。概念很简单,名字很复杂。”——一个务实的工程师
几乎可以肯定:会的。
随着 Claude 能力的持续提升,Anthropic 必然会发明新术语来描述:
- 更高级的自主性(可能叫 “Agentic Reasoning”?)
- 更深度的记忆(可能叫 “Persistent Persona”?)
- 更强的多模态协作(可能叫 “Synthesis”?)
建议:把 Anthropic 的每篇技术博客当作”术语预告片”来读,关注他们在描述什么新能力,而非纠结于他们用了什么新名字。
注:以下内容为解读作者基于官方资料延伸的分析与思考。
Managed Agents 的 Meta-Harness 模式,预示着 AI Agent 平台化的方向:
- 平台提供基础设施(沙箱、会话、权限)
- 开发者提供业务逻辑(Harness 的内容)
- 模型厂商提供智能能力
MCP 协议的出现,意味着 Agent 工具生态正在走向标准化:
- 工具可插拔
- 系统可互操作
- 能力可组合
未来的 Agent 可能会呈现多层次的自主性:
| 层级 | 自主程度 | 适用场景 | | — | — | — | | L1 | 辅助建议 | 用户主导的复杂决策 | | L2 | 自动执行 | 明确边界的重复任务 | | L3 | 自主规划 | 开放性的创新任务 | | L4 | 自我改进 | 持续优化的长期目标 |
Managed Agents 目前主要覆盖 L2-L3,但随着模型能力的提升,更高自主性层级将成为可能。
从这三篇文章来看,Anthropic 的术语迭代速度在加快:
| 时间 | 文章 | 新术语 | | — | — | — | | 2026.03.24 | Harness Design | Harness、Context Reset | | 2026.04.02 | Harnessing Claude’s Intelligence | Skills、Memory Folder、Compaction | | 2026.04.08 | Managed Agents | Meta-Harness、Managed Agents、MCP |
规律:
- 每篇文章都在引入 2-3 个核心新术语
- 新术语往往是对旧概念的重新包装或真正扩展
- 有些术语会”存活”(如 MCP),有些可能只是过渡(如某些特定模式名)
对开发者的建议:
- 跟进阅读:每篇官方博客都是术语预告
- 保持怀疑:新词 ≠ 新概念,区分营销与技术创新
- 聚焦本质:无论叫什么名字,关注它解决什么问题
- 追踪 meta-harness:官方工程博客已明确使用 “meta-harness” 一词,建议开发者直接阅读原文以跟进最新接口变化
- Claude Managed Agents 产品发布(https://claude.com/blog/claude-managed-agents)
- Managed Agents 架构设计(https://www.anthropic.com/engineering/managed-agents)
- Managed Agents 平台文档(https://platform.claude.com/docs/en/managed-agents/overview)

免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:秀逗猫 秀逗猫
秀逗猫《Harness Design实践篇:Managed Agents如何让AI原生应用开发提速10倍》
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/258315.html