2026年Skills 是什么?如何用于 Agent 开发?

Skills 是什么?如何用于 Agent 开发?大家好 我是双越 wangEditor 作者 前百度 滴滴 资深前端工程师 慕课网金牌讲师 PMP 前端面试派 作者 我正致力于两个项目的开发和升级 感兴趣的可以私信我 加入项目小组 划水 AI Node 全栈 AIGC 知识库 包括 AI 写作 多人协同编辑 复杂业务 真实上线 智语 AI Agent 智能体项目 一个智能面试官 可以优化简历 模拟面试 解答题目等

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



大家好,我是双越。wangEditor 作者,前百度 滴滴 资深前端工程师,慕课网金牌讲师,PMP,前端面试派 作者。

我正致力于两个项目的开发和升级,感兴趣的可以私信我,加入项目小组。

  • 划水AI Node 全栈 AIGC 知识库,包括 AI 写作、多人协同编辑。复杂业务,真实上线。
  • 智语 AI Agent 智能体项目。一个智能面试官,可以优化简历、模拟面试、解答题目等。

本文总结了我最近调研和学习 SKILLS 的一些记录,帮助大家对 SKILLS 全面的学习和理解。

SKILLS 本质上就是组织 prompt 提示词。

不仅 SKILLS,很多包装得很复杂的 Agent 框架,剥开来看确实都在做"往 Prompt 里塞什么、怎么塞"这件事。

SKILLS 比传统 prompt 多了一个:按需注入。这样就能极大减少 token 使用量,关键是能省钱

Skills 的概念来源于以下几个演进脉络:

早期开发者发现,同样的任务,提示词写法不同,结果差异巨大。经过大量试错后,好的提示策略需要被复用和共享,Skills 就是这种沉淀的容器。

RAG 是在运行时动态注入外部知识,Skills 借鉴了这个思路——在任务执行前动态注入过程性知识(How-to),而不仅仅是事实性知识。

LLM 有了调用工具的能力后,下一步自然是让 Agent 知道"什么场景用什么工具、怎么用得好",这正是 Skill 要解决的事。

ReAct 等框架让 Agent 有了规划-行动-观察的循环能力,但每个领域的规划策略不同,Skills 为不同领域提供了领域专属的推理引导

Agent Skill = 将人类专家经验编码为 Agent 可读的操作手册,在运行时动态注入,让 Agent 像专家一样执行特定领域任务。

对于单一任务类型的 Agent,Skill 的核心价值——"按需选择合适的知识"——确实没有用武之地。

但 Skill 还有另一个价值维度值得考虑:知识的组织与维护,而不仅仅是"选择"。

即使是单任务 Agent,你仍然面临这些问题:

  • 这个任务的**实践怎么沉淀?
  • Prompt 写在哪、谁来维护、怎么迭代?
  • 新同事怎么快速理解这个 Agent 的设计意图?

这时候 Skill 文档的形式本身是有价值的——它是对 System Prompt 的结构化管理方式,而不只是动态检索的载体。

所以

  • 多任务 Agent:Skill 的动态检索能力是核心价值
  • 单任务 Agent:Skill 作为动态检索机制价值有限,但作为Prompt 知识库的组织形式仍有一定工程价值

如果单任务 Agent 的 Prompt 本身也很简单:那 Skill 机制确实基本没必要引入,直接写死在 System Prompt 里最省事

SKILLS 怎么写,可以看看几个官方的例子。

第一,在 Claude desktop 中内置了很多 SKILLS examples ,例如这个 MCP-builder

image.png

第二,看 SKILLS 官方给出的例子 github.com/anthropics/…

例如这个是 python 处理 PDF 文档的 SKILL

image.png

第三,Vercel 推出的 react best practice skills github.com/vercel-labs…

规定了 AI 编程工具如何正确的编写 React 代码。同理,现在 vue nextjs svelte 也都有了自己的 skills

image.png

在 Claude desktop 中试一试,既然它有 MCP-builder SKill 那就让它开发一个 MCP server

 
  

它会主动搜索 skills ,并识别合适的 skill ,然后按照 skill 里的步骤来操作

image.png

然后就卡在了这里,我一度以为这是卡死了。结果等待了大概 10-15 分钟,终于做完了

image.png

它说明了制作的步骤,使用方法,其中带有哪些 tools ,最后可以下载代码。

image.png

如果没有 skills ,纯靠笨拙的、混在一起的 system prompt ,很难想象 AI 能如此精细的开发一个任务。

Skills 中会定义很多脚本和命令,python 脚本,js 脚本,或者 shell 命令行等。

这些代码和 skill 其他文字一样,也会作为 prompt 被传递给 LLM ,而 LLM 无法直接执行这些代码。它们需要调用 agent 相关的 tools 来执行。

GPT plus 代充 只需 145

如果要自己开发一个 agent ,你需要自己定义执行 python 代码的 tool ,skill 中的 python 脚本才能被执行。

 
  

例如 SKILL 中有如下描述,这里的 JSON 数据就是一个中间数据,不是最终输出。

GPT plus 代充 只需 145

skill 的“中间数据”一般不需要管理,会把这个描述作为 prompt 一起传递个 LLM 统一由 LLM 处理。

但如果中间数据过大,需要提供一个 tool ,让 LLM 调用,写入本地/服务器的临时文件。

 
  

RAG 本质上也是一种信息注入机制,和 Skill 类似,但目的不同:

GPT plus 代充 只需 145

所以 RAG 在架构里的位置是:

 
  

RAG 和 Skill 是同一层次的东西,都在 LLM 推理前注入 Prompt。Skill 给方法,RAG 给数据,Tool 负责执行。

GPT plus 代充 只需 145

说一个真实的例子,用户问"把我们公司 Q3 销售数据生成 Word 报告"

 
  

没有 RAG,LLM 不知道 Q3 数据是什么。 没有 Skill,LLM 不知道怎么规范地生成 Word。 两者缺一不可。

SKILLS 说白了就是一堆文本,而且除了 之外没有其他约定。如果你自己开发 Agent 是需要自己实现 SKILLS 功能的。

以 langChain 框架为例子,要开发 agent 实现 SKILLS 主要有如下步骤。

第一,skills 存储,可以是本地文件,可以是数据库,反正都是文本。

GPT plus 代充 只需 145

第二,按需获取 Skill(按需动态检索),推荐使用向量检索,这样更适合配置多种 skill

 
  

第三,把检索出来的 Skill 注入到 prompt

GPT plus 代充 只需 145

第四,定义必要的 tools 。上文有介绍。

第五,完成 agent 串联,包括 LLM toos prompt ,这就是 agent 最基础的结构了,

 
  

这个 agent 整体的工作流程如下:

GPT plus 代充 只需 145

以上就是我对于 SKILLS 及其周边功能的理解,如果你有新的见解欢迎留言补充。

小讯
上一篇 2026-03-14 16:33
下一篇 2026-03-14 16:31

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/235445.html