今天,Anthropic AI 官方发布消息,宣布完成了新一轮300亿美元的巨额融资,公司估值达到了3800亿美元。

在这笔巨额融资的背后,一个关键的产品战略逐渐清晰:Claude Skills。Anthropic 将 Skills 定位为连接 MCP 与终端用户的知识层,旨在构建一个完整的智能体生态。为此,他们正式发布了完整的构建指南 《The Complete Guide to Building Skills for Claude》。

根据官方定义,Skill 是一个包含指令的文件夹。它的核心作用是教会 Claude 如何处理某个特定的任务或工作流。这改变了以往每次对话都需要重新解释偏好、流程和领域知识的模式,让你能够“教 Claude 一次,处处受益”。
核心文件结构如下:

关键设计原则:渐进式披露
这种设计最大限度地减少了 Token 的使用,同时又保持了专业化的处理能力。
Anthropic 用一个精妙的类比解释了 MCP 与 Skills 的关系:
MCP 提供专业厨房:工具、食材和设备的访问权限。
Skills 提供菜谱:创建特定成果的逐步指令。

这张图清晰地展示了 MCP 作为“连接层”负责对接各类服务,而 Skills 作为“知识层”则告诉 Claude 如何有效地使用这些服务。
没有 Skills 时:
- 用户连接了 MCP 后,往往不知道该用它具体做什么。
- 技术支持工单里充满了“如何用你们的集成做 X?”这类问题。
- 每次对话都几乎从零开始,导致结果不一致。
- 用户可能会抱怨连接器不好用,而实际问题其实是缺少工作流指导。
有了 Skills 后:
- 预构建的工作流能在需要时自动激活。
- 确保了工具使用的一致性和可靠性。
- 将**实践嵌入到每一次交互中。
- 显著降低了集成与使用的学习曲线。
用途:创建一致、高质量的输出,包括文档、演示文稿、应用、设计、代码等。
真实案例:frontend-design skill
- 嵌入样式指南和品牌标准。
- 通过模板结构确保输出一致。
- 最终确定前的质量检查清单。
- 无需外部工具,充分利用 Claude 的内置能力。
用途:适用于受益于一致方法论的多步骤流程,包括跨多个 MCP 服务器的协调。
真实案例:skill-creator skill
- 包含验证环节的分步工作流。
- 针对常见结构提供模板。
- 内置审查和改进建议。
- 迭代优化循环。
用途:增强那些需要访问 MCP 服务器工具的工作流指导。
真实案例:sentry-code-review skill (来自 Sentry)
- 按顺序协调多个 MCP 调用。
- 嵌入领域专业知识。
- 提供用户原本需要手动指定的上下文。
- 针对常见 MCP 问题的错误处理机制。
标准文件结构如下:

前置元数据是 Claude 决定是否加载你技能的主要依据,它是 渐进式披露的第一层级,至关重要。
最小必需格式:
--- name: your-skill-name description: What it does. Use when user asks to [specific phrases]. ---

字段要求详解:

描述字段怎么写,直接决定了你的 Skill 会不会被正确触发。
优秀描述示例: 具体且包含明确的触发词。

推荐的结构模板如下:
— name: your-skill
description: [你的描述]
你的技能名称
指令
步骤 1:[第一个主要步骤]
清晰解释该步骤做什么。
示例: “`bash python scripts/fetch_data.py –project-id PROJECT_ID
(根据需要添加更多步骤)
五、五种核心设计模式
5.1 模式一:顺序工作流编排
适用场景:用户需要按特定顺序执行的多步骤流程。 示例:新客户入职工作流。
| 步骤 | MCP 调用 | 参数/等待条件 |
|---|---|---|
| 1. 创建账户 | create_customer |
name, email, company |
| 2. 设置支付 | setup_payment_method |
等待支付方式验证 |
| 3. 创建订阅 | create_subscription |
plan_id, customer_id (来自步骤1) |
| 4. 发送欢迎邮件 | send_email |
welcome_email_template |
关键技术: * 显式的步骤排序。 * 步骤间的依赖关系管理。 * 每个阶段的验证机制。 * 失败时的回滚指令。
5.2 模式二:多 MCP 协调
适用场景:工作流需要跨越多个服务。 示例:设计到开发交接。
| 阶段 | MCP | 操作 |
|---|---|---|
| 阶段 1:设计导出 | Figma MCP | 1. 从 Figma 导出设计资源 2. 生成设计规范 3. 创建资源清单 |
| 阶段 2:资源存储 | Drive MCP | 1. 在 Drive 创建项目文件夹 2. 上传所有资源 3. 生成可共享链接 |
| 阶段 3:任务创建 | Linear MCP | 1. 创建开发任务 2. 将资源链接附加到任务 3. 分配给工程团队 |
| 阶段 4:通知 | Slack MCP | 1. 在 #engineering 发布交接摘要 2. 包含资源链接和任务引用 |
5.3 模式三:迭代优化
适用场景:输出质量需要通过多次迭代来提升。 示例:报告生成。 1. 初始草稿:获取数据 → 生成初稿 → 保存到临时文件。 2. 质量检查:运行验证脚本 → 识别问题(如缺失章节、格式不一致、数据错误)。 3. 优化循环:解决每个问题 → 重新生成受影响章节 → 重新验证 → 重复直到达到质量阈值。 4. 最终确定:应用最终格式 → 生成摘要 → 保存最终版本。
5.4 模式四:上下文感知工具选择
适用场景:实现相同的结果,但根据具体上下文选择不同的工具。 示例:智能文件存储决策树。 * 大文件(>10MB):使用云存储 MCP。 * 协作文档:使用 Notion/Docs MCP。 * 代码文件:使用 GitHub MCP。 * 临时文件:使用本地存储。
5.5 模式五:领域特定智能
适用场景:技能不仅提供工具访问,还融入了超越工具本身的领域专业知识。 示例:金融合规支付处理。 * 处理前(合规检查):获取交易详情 → 应用合规规则(检查制裁名单、验证司法管辖区、评估风险)→ 记录合规决策。 * 处理中:如果合规通过,则调用支付处理 MCP 工具;否则,创建合规案例供人工审查。 * 审计追踪:记录所有合规检查和处理决策,并生成审计报告。
六、测试与迭代:确保技能质量
6.1 三层测试方法
| 测试类型 | 目标 | 方法 |
|---|---|---|
| 触发测试 | 确保技能在正确的时间加载 | 测试明显任务、请求的不同表述,确保无关主题不会触发。 |
| 功能测试 | 验证技能能产生正确的输出 | 验证输出内容、API 调用是否成功、错误处理是否得当、边缘情况。 |
| 性能对比 | 证明技能确实改善了使用效果 | 对比有/无技能时的 Token 消耗、工具调用次数、任务成功率。 |
6.2 成功指标
定量指标: * 技能在 90% 的相关查询上成功触发。 * 在规定的 X 次工具调用内完成工作流。 * 每次工作流中,失败的 API 调用次数为 0。 定性指标: * 用户无需一步步提示 Claude 下一步该做什么。 * 工作流无需用户手动纠正即可顺利完成。 * 不同会话之间的处理结果保持一致。
6.3 迭代信号与解决方案
| 信号 | 含义 | 解决方案 |
|---|---|---|
| 触发不足 | 技能该加载时不加载 | 在描述中添加更多细节和同义词,包括技术术语。 |
| 过度触发 | 技能为无关的查询加载 | 在描述中添加负面触发条件,使定义更具体。 |
| 执行问题 | 结果不一致、API 调用失败 | 改进指令的清晰度,添加更完善的错误处理逻辑。 |
结语
这份指南为我们揭示了 Claude 从“能做什么”到“应该如何做”的关键进化路径——Skills。通过将业务知识、工作流规范和**实践封装为可复用的技能,企业和开发者能够极大地提升 AI Agent 的自动化水平和专业能力。
核心要点在于理解 Skills 作为“知识层”与 MCP 的“连接层”之间的互补关系,并熟练运用五种核心设计模式来解决实际场景中的问题。从清晰的 YAML 元数据定义,到结构化的指令编写,再到严谨的测试迭代流程,每一步都决定了最终技能的可用性和可靠性。
对于希望深度应用 人工智能 能力的团队而言,掌握 Skill 的开发与设计,无异于掌握了构建高效、智能工作流的“菜谱”。如果你想进一步探讨如何将这些模式应用到你的具体业务中,或者寻找更多相关的 技术文档 和案例,欢迎来 云栈社区 与大家一起交流。
官方指南下载地址: https://resources.anthropic.com/hubfs/The-Complete-Guide-to-Building-Skill-for-Claude.pdf?hsLang=en
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/277393.html