MCP 服务器配置:让 AI 助手直接解析 PDF 文档

MCP 服务器配置:让 AI 助手直接解析 PDF 文档给 Claude Desktop Cursor 配置 MinerU MCP Server 对它说 帮我读取这个 PDF 它就调用 MinerU 解析 MinerU 是上海人工智能实验室开源的文档解析工具 可以把 PDF Word PPT 图片转换成 Markdown JSON 等结构化格式 最近团队发布了 MinerU2 5 Pro

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



给 Claude Desktop / Cursor 配置MinerU MCP Server,对它说"帮我读取这个 PDF",它就调用 MinerU 解析。


MinerU 是上海人工智能实验室开源的文档解析工具,可以把 PDF、Word、PPT、图片转换成 Markdown、JSON 等结构化格式。

最近团队发布了 MinerU2.5-Pro (2026年4月),在 OmniDocBench v1.6 基准上拿到了 95.69 分 ,刷新生态最好成绩。更难得的是,这个成绩是在 1.2B 参数小体量下达成的,参数量不到同类方案的 1/200,纯靠数据工程驱动。

MinerU 的核心能力:

能力 说明 版面分析 多栏识别、阅读顺序、页眉页脚过滤 文本识别 109 种语言 OCR 公式识别 复杂数学公式转 LaTeX 表格提取 PDF 表格结构化输出 图片处理 图表、嵌入图像、内容保留

没有 GPU?没关系,MinerU 提供云端 API(mineru.net),不用自己部署,直接调用。MCP Server 让 AI 助手直接调用 MinerU,零配置实现"对话即解析"。


MCP(Model Context Protocol)是 AI 助手调用外部工具的标准协议。配置好后,Claude/Cursor 等 MCP 兼容的 AI 客户端就能直接调用 MinerU 解析 PDF。


只要你的电脑装了 uv(Python 包管理器),就能直接跑,不需要单独安装 MCP Server:

 
     
    
       
uvx mineru-open-mcp

这条命令会启动 MCP Server,后续在 AI 客户端里配置连接方式即可。


编辑配置文件:

  • macOS~/Library/Application Support/Claude/claude_desktop_config.json
  • Windows%APPDATA%Claudeclaude_desktop_config.json
{ "mcpServers": { "mineru": { "command": "uvx", "args": ["mineru-open-mcp"], "env": { "MINERU_API_TOKEN": "你的token" } } } }

重启 Claude Desktop,即可使用。

编辑:~/.cursor/mcp.json(macOS)或 %USERPROFILE%.cursormcp.json(Windows):

 
      
    
        
{ 

"mcpServers": {

"mineru": { "command": "uvx", "args": ["mineru-open-mcp"], "env": { "MINERU_API_TOKEN": "你的token" } } 

} }

 

配置文件:~/.windsurf/mcp.json

 
      
    
        
{ 

"mcpServers": {

"mineru": { "command": "uvx", "args": ["mineru-open-mcp"], "env": { "MINERU_API_TOKEN": "你的token" } } 

} }

 
      
    
        
MINERU_API_TOKEN=你的token mineru-open-mcp --transport streamable-http --port 8001
{ 

"mcpServers": {

"mineru": { "type": "streamableHttp", "url": "http://127.0.0.1:8001/mcp" } 

} }

 

这种模式适合:多个 AI 客户端共享一个 MCP Server,或者需要远程调用时使用。


Flash(免登录) 精准(需要 Token) 身份验证 无需 Token 需要 MINERU_API_TOKEN 文件限制 20 页 / 10 MB 600 页 / 200 MB 输出格式 仅 Markdown Markdown + Word + HTML + LaTeX 适用场景 快速预览 正式使用

配置了 MINERU_API_TOKEN 环境变量后,自动切换到精准模式。


配置成功后,你可以在 AI 对话中直接调用:

解析本地文件或远程 URL:

 
        
    
          
请帮我读取 /path/to/document.pdf 的内容
请提取 https://example.com/paper.pdf 的主要内容

支持格式:PDF、DOCX、PPTX、JPG、PNG、HTML。

查询 MinerU 支持的 OCR 语言:

 
        
    
          
MinerU 支持哪些语言的 OCR?

变量 说明 默认值 MINERU_API_TOKEN API Token,精准模式必需 —(Flash 模式可选) OUTPUT_DIR 解析结果保存目录 /mineru-downloads ENABLE_LOG 开启日志 false MINERU_LOG_DIR 日志目录 /.mineru-open-mcp/logs/

开启日志:

 
         
    
           
{ 

"mcpServers": {

"mineru": { "command": "uvx", "args": ["mineru-open-mcp"], "env": { "MINERU_API_TOKEN": "你的token", "ENABLE_LOG": "true", "MINERU_LOG_DIR": "/Users/you/mineru-logs" } } 

} }

 

日志文件位置:~/.mineru-open-mcp/logs/log_ .txt


  • MCP Server 完整文档:github.com/opendatalab…
  • MCP 协议说明:modelcontextprotocol.io
  • Token 申请:mineru.net/apiManage/t…

小讯
上一篇 2026-04-12 07:34
下一篇 2026-04-12 07:32

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/257287.html