做 AI Agent 的开发者都面临一个两难:用 Opus 聪明但贵,用 Sonnet 便宜但关键时刻掉链子。Anthropic 最新推出的「顾问策略」(Advisor Strategy)和 Monitor 工具,把这个难题变成了一个 API 参数的事。
这篇文章带你实操这两个功能,从 API 调用到成本计算,一步不落。
传统做法是让最强模型当「编排者」,把大任务拆成子任务分给小模型。问题在于,无论任务简单还是复杂,每条请求开头都要烧掉最贵的 Token。
顾问策略反过来了:让 Sonnet/Haiku 当执行者冲在前面,只有遇到难题时才向 Opus 请教。Opus 不直接和人对话,也不调用工具,只负责看上下文、给建议。
实测数据:
在 Messages API 请求中声明 advisor_ 即可。模型的交接在单次 /v1/messages 请求内部静默完成,不需要额外回传数据或管理上下文。
response = client.messages.create( model="claude-sonnet-4-6", # 执行者 tools=[ { "type": "advisor_", "name": "advisor", "model": "claude-opus-4-6", # 顾问 "max_uses": 3, # 最多请 Opus 出手 3 次 }, # ... 你的其他工具 ], messages=[...] ) # 顾问消耗的 Token 会在 usage 中单独列出
关键参数说明:
model: 指定执行者模型(Sonnet 或 Haiku)advisor_: 顾问工具类型,固定值advisor.model: 指定顾问模型(通常选 Opus)max_uses: 限制单次请求中顾问最大调用次数,防止 Token 超支
顾问消耗的 Token 按 Opus 定价,执行者消耗的 Token 按 Sonnet 或 Haiku 定价。
关键在于,顾问每次出手只生成一份简短的计划,通常 400 到 700 个 Token。而真正的大头输出,全部由执行者以更低的费率包揽。
三种组合的适用场景:
- Haiku + Opus 顾问:高并发、预算敏感场景,成本最低
- Sonnet + Opus 顾问:平衡性能和成本的日常选择
- Opus + Opus 顾问:最高质量,适合关键任务
提示: 用
max_uses控制顾问调用次数。顾问的 Token 消耗在 usage 信息中单独列出,方便追踪每一层模型的开销。
同一天,Anthropic 还推出了 Monitor 工具。它解决的是另一个烧钱问题:Agent 空转。
过去让 Agent 监控某个任务(比如等 CI 跑完),它必须不停循环询问,每问一次就烧一轮 Token。Monitor 让 Claude 自己写一段后台监控代码,从「主动轮询」变成「事件驱动」。
典型用法:
- 持续监控系统日志中的错误,有问题了才叫 Agent 处理
- 自动追踪 GitHub 上的 PR 状态,脚本在后台轮询,Agent 不消耗 Token
- 等待外部事件(邮件到达、部署完成)后唤醒 Agent
Monitor 和顾问策略的逻辑一脉相承:找到「不需要烧钱的环节」,把它剥离出去。一个省模型调用的钱,一个省空转循环的钱。
确保你的 Anthropic API 账户已开通,且有足够的 Token 额度。顾问策略目前已在 Claude 平台上线测试版。
在你现有的 Agent 代码中,找到 client.messages.create 调用处,添加 advisor 工具配置:
import anthropic client = anthropic.Anthropic() response = client.messages.create( model="claude-sonnet-4-6", max_tokens=4096, tools=[ { "type": "advisor_", "name": "advisor", "model": "claude-opus-4-6", "max_uses": 3, }, # 你现有的工具定义... ], messages=[ {"role": "user", "content": "你的任务描述"} ] ) # 检查顾问的使用情况 print(response.usage)
在返回的 usage 对象中,顾问和执行者的 Token 消耗是分开统计的。你可以据此优化 max_uses 参数,在质量和成本之间找到平衡点。
对于需要长时间监控的场景,在提示词中明确要求 Claude 创建后台监控脚本,替代轮询循环。
- Q: 顾问策略和普通的模型路由有什么区别? A: 传统路由需要你写逻辑判断什么时候切换模型。顾问策略让执行者自己决定什么时候「摇人」,所有操作在同一个 API 请求内完成。
- Q: max_uses 设多少合适? A: 简单任务 1-2 次,复杂编程任务 3-5 次。可以先用 3 次试跑,根据 usage 数据调整。
- Q: 顾问策略兼容现有工具栈吗? A: 完全兼容。advisor 就是 Messages API 请求里的一个普通工具条目,你的 Agent 可以一边搜索网页、执行代码,一边向 Opus 请教。
- Anthropic 官方博客:https://claude.com/blog/claude-managed-agents
- Advisor Strategy API 文档:https://platform.claude.com/docs
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/258278.html