TextIn xParse Skill上架ClawHub，行业标杆级文档解析免费用！

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

 TextIn xParse 文档解析 Skill 正式上架 ClawHub。

在 OpenClaw 里和 Agent 说一句话，你就能把 PDF、Word、PPT、Excel 甚至长截图，各种真实场景下复杂的文档变成干净的 Markdown。

即刻体验：TextIn xParse Document Parse — ClawHub

免费可用❗每日 1000 页额度，零门槛上手。

Agent 正在成为新的应用范式。

OpenClaw 生态里上万 Skills 的涌现说明了方向：开发者们把能力拆解成可插拔、可复用的单元，Agent 按需加载，写代码、查资料、调 API ，越来越像一个能自主行动的“数字员工”。

但这里有一个被反复低估的问题：Agent 进入企业和真实业务时，真正的瓶颈不是模型会不会思考，而是苦于没有高精度的上下文。

企业沉淀了大量非结构化资料 —— PDF里的合同条款、Word 里的产品手册、Excel 里的经营数据、PPT里的战略规划，这些文档承载着真正有价值的信息，而 Agent 用不上。

格式不统一、结构不稳定、字段不规范，对模型来说，这是一大段昂贵又“读不透”的上下文。

为了解决这个问题，Karpathy 构建了 LLM.Wiki，把这个过程称为“编译”。

概念很精准。但从原始文档到 Agent 真正可用的输入，中间缺的这一步，远比想象中更难填。

这也是我们今天想聊的方向。

智能文字识别，合合信息做了19年。在文档解析上，我们一直做得比较深，只是过去这些能力是闭源的、商用的。

去年以来，开源 OCR 大模型百花齐放。生态在往前走，我们也在想，当 Agent 这个新范式正在成型，我们能贡献点什么。

TextIn xParse 文档解析Skill，是第一个答案。

它的核心能力很简单，却很扎实：

全格式兼容：支持PDF、Word、Excel、PPT、图片等十余种格式的输入；
结构完整还原：跨页表格、目录层级、页眉页脚、标题结构……完整保留文档骨架；
极速解析：百页文档约1.5秒完成，从容应对企业大规模文档批处理；
Markdown 输出：输出保留文档层级与语义的 Markdown 格式，这是目前最受LLM和Agent欢迎的知识形态；
精确坐标回显：返回块级及字符级坐标信息，代表解析结果在原文档中的精确位置，方便前端可视化展示和后续审核校对。

对企业级开发者和 OpenClaw 深度玩家来说，商业级的稳定性、可用性和效果是能把产品真正跑在生产环境里的保障。

现在，我们把过去 19 年沉淀在企业场景里的能力，以最轻量、最友好的方式，压缩成一个 Skill，交到开发者手里。

不用写代码、不用调 API。

在 OpenClaw、ZeroClaw、Claude Code等 Agent 平台装上 xparse-parse Skill，只需要说一句话，它就能自动完成文档解析、格式转换全部流程。

你可以这样说：

"帮我读一下这份PDF合同，提取关键条款" "把这个报告转成Markdown，保存到桌面" "这份加密PDF密码是，帮我解析前10页" "提取这张表格图片里的内容，输出JSON" …… # 更多高阶玩法，等你探索

支持格式：

方式一：通过各类Agent或Claw安装

在 Agent 对话框直接说：

帮我从 技能市场 安装 intsig-textin/xparse-parser 如果技能市场里没有，则通过npx安装：npx skills add intsig-textin/xparse-skills --yes -textin/xparse-skills；https://gitee.com/intsig-textin/xparse-skills

方式二：手动安装

从以下任一地址下载 zip 文件，解压后，放到 agent 对话框，让模型使用解压里面的 skill.md 文件即可：

GitHub:
https://github.com/intsig-textin/xparse-skills
Gitee:
https://gitee.com/intsig-textin/xparse-skills
ClawHub:
https://clawhub.ai/intsig-textin/xparse-parser

回到开头 Karpathy “编译”的概念。

TextIn xParse 做的，不只是OCR意义上的“识别”。它更像是一个知识接入的过程——

把原始文档编译成 Markdown；
把混乱格式编译成结构化信息；
把非结构化资料编译成 Agent 的知识入口。

经过这个过程，PDF、Word、PPT 这些原始文档就成为了一套可以被 Agent 持续消费、反复调用、不断演化的知识资产；

而 Agent 可以基于这套资产做检索、做问答、做分析、做报告，不管后面接的是知识库、Wiki、RAG 还是多 Agent 协作工作流。

这也是 xParse 真正想站的位置：不是 OCR 的终点，而是 Agent 接入知识的起点 。

这次上线是一个信号：我们将把过去19年沉淀在企业场景里的智能文档能力，逐步转成真正服务 Agent 生态的基础组件。

对开发者来说，这意味着能省去文档解析层的长期技术积累，直接获得企业级的稳定性保障。

而这个开放刚刚开始。接下来，我们会围绕“Agent 需要什么样的文档能力”继续迭代，不是堆功能，是补能力。

TextIn xParse Skill上架ClawHub，行业标杆级文档解析免费用！

相关推荐