一个Skill文件夹里都有什么,核心的SKILL.md怎么写?
区别很明显——好的描述有具体触发词,AI知道用户说什么话该调用这个Skill。坏的太笼统,AI不知道什么时候该用。
一个告诉AI具体做什么、出了问题怎么办,另一个等于什么都没说。关键规则放最前面,重要步骤用"必须"标出来,每步说清楚成功是什么样。
- 文件名必须是SKILL.md,大小写完全一致,写成skill.md不认。
- 文件夹名用小写加短横线,比如brand-checker,不能有空格和大写。
- 文件夹里不要放README.md。
这些看着琐碎,但搞错了可能导致Skill直接无法被加载。
分析一下这个skills.
一、核心定义:PDF 技能的适用范围
这份文档首先明确了 这个技能的核心定位:
- 触发条件:只要用户提及 文件,或要求生成 PDF 文件,就启用该技能
- 覆盖场景:几乎包含所有 PDF 操作,具体有:
- 读取/提取文本/表格
- 合并/拆分 PDF
- 旋转页面、添加水印
- 创建新 PDF、填写 PDF 表单
- 加密/解密 PDF、提取图片
- 对扫描版 PDF 做 OCR 识别(使其可检索)
- 授权说明:该技能为专有授权,完整条款在 LICENSE.txt 中
文档提供了 Python 代码和命令行两种实现方式,覆盖不同使用场景:
库名 核心用途 关键示例 基础操作(合并、拆分、旋转、加密/解密、加水印) 合并多PDF为一个、拆分PDF为单页文件、旋转页面90度、给PDF加密码保护 高精度文本/表格提取 保留排版提取文本、提取表格并转为Excel文件 创建新PDF 生成带文字/线条的基础PDF、多页PDF报告;⚠️ 注意:不能用Unicode上下标字符,需用标签 扫描版PDF的OCR识别 先将PDF转图片,再对图片做文字识别
工具 核心用途 关键命令 (poppler-utils) 提取文本 保留排版提取文本、提取指定页码范围的文本 合并、拆分、旋转、解密 合并PDF、拆分指定页码、旋转页面、移除PDF密码 合并、拆分、旋转(备选) 合并PDF、拆分所有页面、旋转页面
- 快速参考表:文档最后整理了「任务-**工具-核心代码/命令」的对应关系,方便快速查阅(比如提取表格优先用 pdfplumber,命令行合并优先用 qpdf)
- 扩展文档:
- 高级功能(pypdfium2、JavaScript 库 pdf-lib):参考 REFERENCE.md
- PDF 表单填写:参考 FORMS.md
- 故障排除:参考 REFERENCE.md
这份文档的核心信息可以概括为:
- 功能全覆盖:定义了一个能处理所有 PDF 常见操作的技能,明确了触发条件和授权规则;
- 方案双轨制:提供 Python 代码(灵活定制)和命令行(快速操作)两种实现方式,适配不同使用场景;
- 工具分场景:不同 PDF 操作推荐对应最优工具(如提取表格用 pdfplumber、创建 PDF 用 reportlab),并标注了关键注意事项(如 reportlab 的上下标使用规范)。
OpenClaw这5个核心Skills:tavily-search(实时联网查资讯)、vision(识别图像文字)、summarize(提炼网页/PDF内容)、find-skills(智能匹配适用技能)、self-improving(自动修正错误并成长)。安装时直接说“安装XXX技能”即可生效。
加油,最近AI太火,终于用武有地了。已经坚持FPGA和AI 有8年了。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/227838.html