TextIn xParse 文档解析 Skill 正式上架 ClawHub。
在 OpenClaw 里和 Agent 说一句话,你就能把 PDF、Word、PPT、Excel 甚至长截图,各种真实场景下复杂的文档变成干净的 Markdown。
即刻体验:TextIn xParse Document Parse — ClawHub
免费可用❗每日 1000 页额度,零门槛上手。
Agent 正在成为新的应用范式。
OpenClaw 生态里上万 Skills 的涌现说明了方向:开发者们把能力拆解成可插拔、可复用的单元,Agent 按需加载,写代码、查资料、调 API ,越来越像一个能自主行动的“数字员工”。
但这里有一个被反复低估的问题:Agent 进入企业和真实业务时,真正的瓶颈不是模型会不会思考,而是苦于没有高精度的上下文。
企业沉淀了大量非结构化资料 —— PDF里的合同条款、Word 里的产品手册、Excel 里的经营数据、PPT里的战略规划,这些文档承载着真正有价值的信息,而 Agent 用不上。
格式不统一、结构不稳定、字段不规范,对模型来说,这是一大段昂贵又“读不透”的上下文。
为了解决这个问题,Karpathy 构建了 LLM.Wiki,把这个过程称为“编译”。
概念很精准。但从原始文档到 Agent 真正可用的输入,中间缺的这一步,远比想象中更难填。
这也是我们今天想聊的方向。
智能文字识别,合合信息做了19年。在文档解析上,我们一直做得比较深,只是过去这些能力是闭源的、商用的。
去年以来,开源 OCR 大模型百花齐放。生态在往前走,我们也在想,当 Agent 这个新范式正在成型,我们能贡献点什么。
TextIn xParse 文档解析Skill,是第一个答案。
它的核心能力很简单,却很扎实:
- 全格式兼容:支持PDF、Word、Excel、PPT、图片等十余种格式的输入;
- 结构完整还原:跨页表格、目录层级、页眉页脚、标题结构……完整保留文档骨架;
- 极速解析:百页文档约1.5秒完成,从容应对企业大规模文档批处理;
- Markdown 输出:输出保留文档层级与语义的 Markdown 格式,这是目前最受LLM和Agent欢迎的知识形态;
- 精确坐标回显:返回块级及字符级坐标信息,代表解析结果在原文档中的精确位置,方便前端可视化展示和后续审核校对。
对企业级开发者和 OpenClaw 深度玩家来说,商业级的稳定性、可用性和效果是能把产品真正跑在生产环境里的保障。
现在,我们把过去 19 年沉淀在企业场景里的能力,以最轻量、最友好的方式,压缩成一个 Skill,交到开发者手里。
不用写代码、不用调 API。
在 OpenClaw、ZeroClaw、Claude Code等 Agent 平台装上 xparse-parse Skill,只需要说一句话,它就能自动完成文档解析、格式转换全部流程。
你可以这样说:
"帮我读一下这份PDF合同,提取关键条款" "把这个报告转成Markdown,保存到桌面" "这份加密PDF密码是,帮我解析前10页" "提取这张表格图片里的内容,输出JSON" …… # 更多高阶玩法,等你探索
支持格式:
方式一:通过各类Agent或Claw安装
在 Agent 对话框直接说:
帮我从 技能市场 安装 intsig-textin/xparse-parser 如果技能市场里没有,则通过npx安装:npx skills add intsig-textin/xparse-skills --yes -textin/xparse-skills;https://gitee.com/intsig-textin/xparse-skills
方式二:手动安装
从以下任一地址下载 zip 文件,解压后,放到 agent 对话框,让模型使用解压里面的 skill.md 文件即可:
- GitHub:
https://github.com/intsig-textin/xparse-skills - Gitee:
https://gitee.com/intsig-textin/xparse-skills - ClawHub:
https://clawhub.ai/intsig-textin/xparse-parser
回到开头 Karpathy “编译”的概念。
TextIn xParse 做的,不只是OCR意义上的“识别”。它更像是一个知识接入的过程——
- 把原始文档编译成 Markdown;
- 把混乱格式编译成结构化信息;
- 把非结构化资料编译成 Agent 的知识入口。
经过这个过程,PDF、Word、PPT 这些原始文档就成为了一套可以被 Agent 持续消费、反复调用、不断演化的知识资产;
而 Agent 可以基于这套资产做检索、做问答、做分析、做报告,不管后面接的是知识库、Wiki、RAG 还是多 Agent 协作工作流。
这也是 xParse 真正想站的位置:不是 OCR 的终点 ,而是 Agent 接入知识的起点 。
这次上线是一个信号:我们将把过去19年沉淀在企业场景里的智能文档能力,逐步转成真正服务 Agent 生态的基础组件。
对开发者来说,这意味着能省去文档解析层的长期技术积累,直接获得企业级的稳定性保障。
而这个开放刚刚开始。接下来,我们会围绕“Agent 需要什么样的文档能力”继续迭代,不是堆功能,是补能力。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/259454.html