2026年蓝迪哥玩转Ai(3)----SKILLS写法和OPENCLAW新变化

科技前沿 • 2026-04-01 09:10 • 阅读 0

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

一个Skill文件夹里都有什么，核心的SKILL.md怎么写？

区别很明显——好的描述有具体触发词，AI知道用户说什么话该调用这个Skill。坏的太笼统，AI不知道什么时候该用。

一个告诉AI具体做什么、出了问题怎么办，另一个等于什么都没说。关键规则放最前面，重要步骤用"必须"标出来，每步说清楚成功是什么样。

文件名必须是SKILL.md，大小写完全一致，写成skill.md不认。
文件夹名用小写加短横线，比如brand-checker，不能有空格和大写。
文件夹里不要放README.md。
这些看着琐碎，但搞错了可能导致Skill直接无法被加载。

分析一下这个skills.

一、核心定义：PDF 技能的适用范围

这份文档首先明确了这个技能的核心定位：

触发条件：只要用户提及文件，或要求生成 PDF 文件，就启用该技能
覆盖场景：几乎包含所有 PDF 操作，具体有：
1. 读取/提取文本/表格
2. 合并/拆分 PDF
3. 旋转页面、添加水印
4. 创建新 PDF、填写 PDF 表单
5. 加密/解密 PDF、提取图片
6. 对扫描版 PDF 做 OCR 识别（使其可检索）
授权说明：该技能为专有授权，完整条款在 LICENSE.txt 中

文档提供了 Python 代码和命令行两种实现方式，覆盖不同使用场景：

库名核心用途关键示例基础操作（合并、拆分、旋转、加密/解密、加水印）合并多PDF为一个、拆分PDF为单页文件、旋转页面90度、给PDF加密码保护高精度文本/表格提取保留排版提取文本、提取表格并转为Excel文件创建新PDF 生成带文字/线条的基础PDF、多页PDF报告；⚠️ 注意：不能用Unicode上下标字符，需用标签扫描版PDF的OCR识别先将PDF转图片，再对图片做文字识别

工具核心用途关键命令（poppler-utils）提取文本保留排版提取文本、提取指定页码范围的文本合并、拆分、旋转、解密合并PDF、拆分指定页码、旋转页面、移除PDF密码合并、拆分、旋转（备选）合并PDF、拆分所有页面、旋转页面

快速参考表：文档最后整理了「任务-**工具-核心代码/命令」的对应关系，方便快速查阅（比如提取表格优先用 pdfplumber，命令行合并优先用 qpdf）
扩展文档：
- 高级功能（pypdfium2、JavaScript 库 pdf-lib）：参考 REFERENCE.md
- PDF 表单填写：参考 FORMS.md
- 故障排除：参考 REFERENCE.md

这份文档的核心信息可以概括为：

功能全覆盖：定义了一个能处理所有 PDF 常见操作的技能，明确了触发条件和授权规则；
方案双轨制：提供 Python 代码（灵活定制）和命令行（快速操作）两种实现方式，适配不同使用场景；
工具分场景：不同 PDF 操作推荐对应最优工具（如提取表格用 pdfplumber、创建 PDF 用 reportlab），并标注了关键注意事项（如 reportlab 的上下标使用规范）。

OpenClaw这5个核心Skills：tavily-search（实时联网查资讯）、vision（识别图像文字）、summarize（提炼网页/PDF内容）、find-skills（智能匹配适用技能）、self-improving（自动修正错误并成长）。安装时直接说“安装XXX技能”即可生效。

加油，最近AI太火，终于用武有地了。已经坚持FPGA和AI 有8年了。

2026年蓝迪哥玩转Ai(3)----SKILLS写法和OPENCLAW新变化

一、核心定义：PDF 技能的适用范围

相关推荐