微信
ezpoda免费咨询:AI编程 | AI模型微调| AI私有化部署
AI工具导航 | ONNX模型库 | Tripo 3D | Meshy AI | ElevenLabs | KlingAI | ArtSpace | Phot.AI | InVideo
首先,如果你一直在使用AI智能体或构建智能体,你知道常见的问题。
你花更多的时间在逻辑上而不是产品上。
智能体循环、工具执行、上下文管理、沙箱和会话处理;所有这些都需要你在编写真正的逻辑代码之前从零开始搭建。
当任务中途出现问题时,你又回到了调试基础设施而不是交付产品。
这就是Claude托管智能体承诺要解决的问题。 Anthropic不再给我们另一个需要包装循环的API,而是直接提供运行时环境。
这是一个完全托管的云环境,Claude可以在其中读取文件、运行命令、浏览网页并自主执行代码。
会话连续性和上下文管理已经内置。我花时间进行了全面审查,看看它是否名副其实。
Anthropic推出了两个产品:
- 首先是Claude托管智能体 —— 一个完全托管的智能体框架,运行在Anthropic的基础设施上。你定义智能体,启动任务,Anthropic的云处理其他一切:容器、工具、执行、会话。
- 其次是Claude智能体SDK(前身为Claude Code SDK) —— 一个Python和TypeScript库,将驱动Claude Code的相同智能体循环嵌入到你自己的应用程序中。你自己托管,但所有困难的部分都已预先构建好。
两者解决的是同一个问题,但区别在于智能体运行在哪里。
- SDK — 智能体在你自己的基础设施内运行
- 托管智能体 — 智能体在Anthropic的云端运行,完全托管
对于阅读本文的大多数开发者来说,托管智能体是更重要的发布,本文我们将重点介绍Claude托管智能体。
托管智能体围绕四个概念构建。一旦你理解了这些,整个系统就清晰了:
你的应用程序向运行在Anthropic云中的会话发送事件,智能体和环境已经在那里配置好了
- 智能体 — 你的配置:模型、系统提示、工具、MCP服务器和技能。定义一次,在每个会话中通过ID引用。
- 环境 — 一个云容器,预装了包(Python、Node.js、Go等)、网络访问规则和挂载的文件。这是你的智能体操作的工作空间。
- 会话 — 在环境中运行的智能体实例,执行特定任务。文件、对话历史和上下文在其生命周期内都会持久化。
- 事件 — 在你的应用程序和智能体之间流动的消息:用户输入、工具结果、状态更新和流式响应。
以下是代码中的样子。你创建一次智能体:
import anthropic
client = anthropic.Anthropic()
创建智能体 —— 只做一次,通过ID重用
agent = client.beta.agents.create(
model="claude-sonnet-4-6", system="You are a software engineer. Fix bugs, run tests, and report results.", tools=[{"type": "bash"}, {"type": "file_operations"}, {"type": "web_search"}], name="bug-fixer"
)
print(agent.id) # 保存这个 —— 你将在各个会话中引用它
然后启动会话并发送任务:
# 创建包含智能体所需包的环境 environment = client.beta.environments.create( packages=["pytest", "requests"]
)
启动引用智能体和环境的会话
session = client.beta.sessions.create(
agent_id=agent.id, environment_id=environment.id
)
将任务作为事件发送
response = client.beta.sessions.events.create(
session_id=session.id, content="Find and fix the failing tests in auth.py"
)
这就是完整的设置,包括一个智能体定义、环境和会话;然后Claude接管。
当你启动会话时,Claude不会只响应一次然后等待。
它运行一个连续循环:接收提示、评估任务、调用工具、处理结果、重复;直到任务完成。每个完整的往返是一个回合。
Claude评估、调用工具、处理结果,并在每个回合中自主重复,直到任务完成或达到限制
以下是真实任务”查找并修复auth.py中失败的测试”的示例:
- 第1回合 — Claude通过Bash运行测试套件。返回三个失败。
- 第2回合 — Claude读取
auth.py测试文件以了解问题。 - 第3回合 — Claude编辑文件并重新运行测试。三个都通过了。
- 最终回合 — Claude返回一个没有工具调用的文本响应。任务完成。
以下是会话在代码中的样子:
import anthropic client = anthropic.Anthropic()
async for event in client.beta.sessions.stream(
session_id=session.id, event={ "type": "user", "content": "Find and fix the failing tests in auth.py" }
):
# 查看Claude每个回合在做什么 if event.type == "assistant_message": print(event.content) # 捕获最终结果 if event.type == "result": print(f"Done: {event.result}") print(f"Turns used: {event.num_turns}") print(f"Cost: ${event.total_cost_usd:.4f}") session_id = event.session_id # 保存以稍后恢复
这个流为你提供完整的可见性:每个工具调用、结果和实时发生的回合。
破坏大多数DIY智能体设置的一点是上下文。
每个回合都会增加上下文窗口:提示、工具定义、文件读取、命令输出和对话历史。一旦达到限制,会话就会终止。
托管智能体自动处理这个问题。
当上下文窗口接近限制时,系统通过总结较旧的历史来压缩对话,以释放空间,同时保留最近的交流和关键决策。
这种方法允许会话不间断地继续。
努力程度 —— 控制Claude在每个回合上的推理深度。
有目的地设置它,因为它会影响token使用和成本。
最大回合数和预算 —— 在循环失控之前设置上限。
session = client.beta.sessions.create( agent_id=agent.id, environment_id=environment.id, max_turns=20, # 20个工具使用回合后停止 max_budget_usd=0.50 # 或当花费达到$0.50时停止
)
当达到任一限制时,会话返回一个清晰的结果子类型,这样你就知道它为什么停止,如果需要,你可以使用会话ID恢复。
权限模式 —— 控制Claude可以在不询问的情况下做什么。
default—— 任何未经预先批准的内容都通过你的回调进行门控acceptEdits—— 自动批准文件编辑,仍然对shell命令进行门控bypassPermissions—— 无需提示运行一切,仅用于隔离容器和CI
当会话正在运行时,你可以发送额外的事件来重定向它、添加上下文或停止它。
# 发送会话中更正 client.beta.sessions.events.create( session_id=session.id, content="Actually, only fix the auth_token tests — leave the login tests alone"
)
如果Claude方向错误,你不必等待它完成。
会话也是持久的;你可以捕获会话ID,并可以从你离开的地方恢复。
# 恢复之前的会话 async for event in client.beta.sessions.stream( session_id="sess_abc123", # 来自之前的运行 event={"type": "user", "content": "Continue — now fix the payment module too"}
):
if event.type == "result": print(event.result)
手动构建智能体时最大的时间浪费之一是工具执行。
编写包装器、处理错误、将结果管理回上下文中。使用托管智能体,这些工作已经完成。
以下是完整的工具集:
所有内置工具在Claude托管智能体中可用,按类别分组
Read—— 读取容器中的任何文件Write—— 创建新文件Edit—— 修改现有文件
Glob—— 按模式查找文件Grep—— 使用正则表达式搜索内容
Bash—— 运行shell命令、脚本、git操作、安装包、运行测试
WebSearch—— 搜索互联网WebFetch—— 从任何URL获取和解析完整页面内容
Task—— 生成子智能体进行隔离工作Skill—— 调用可重用工作流AskUserQuestion—— 暂停并请求人工输入TodoWrite—— 在会话中跟踪多步骤工作
除了内置工具外,你还可以通过MCP服务器连接外部服务,并使用自己的处理程序定义自定义工具。
Claude托管智能体目前处于测试阶段。
所有API账户默认启用访问;如果你已经有Claude API密钥,就可以开始。
你需要:
- 来自platform.claude.com的Claude API密钥
- 所有请求都需要
managed-agents-2026-04-01测试版header - Python或TypeScript SDK —— SDK自动设置header
安装SDK:
pip install anthropic
设置你的API密钥:
export ANTHROPIC_API_KEY=your-api-key
20行以内的第一个工作智能体:
import anthropic import asyncio client = anthropic.Anthropic()
async def main():
agent = client.beta.agents.create( model="claude-sonnet-4-6", system="You are a helpful engineering assistant.", tools=[{"type": "bash"}, {"type": "file_operations"}], name="my-first-agent" ) environment = client.beta.environments.create( packages=["pytest"] ) session = client.beta.sessions.create( agent_id=agent.id, environment_id=environment.id, max_turns=10, max_budget_usd=0.25 ) async for event in client.beta.sessions.stream( session_id=session.id, event={"type": "user", "content": "List all Python files in this directory"} ): if event.type == "result": print(event.result) print(f"Cost: ${event.total_cost_usd:.4f}")
asyncio.run(main())
三个特性:
- 结果
- 多智能体协调
- 持久记忆
所有功能都在研究预览中,需要在claude.com/form/claude-managed-agents单独申请访问。
Claude托管智能体是一个绝妙的主意;智能体循环、上下文管理、工具执行和会话连续性。
过去需要数周的基础设施工作现在只需要一个配置文件和一个API调用。这是快速构建生产级智能体的一大步。
权衡是,输出质量仍然取决于输入质量。
原文链接: Anthropic Launches Claude Managed Agents (That Make Agentic AI Workflows Real)
汇智网翻译整理,转载请标明出处
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/259300.html