2026年Mano-P 1.0：明略科技开源的端侧GUI-VLA智能体，自主完成复杂电脑操作

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

 Mano-P 1.0是明略科技（Mininglamp-AI）开源的GUI-VLA（Vision-Language-Action）端侧智能体模型，核心定位为面向个人与企业的本地计算机使用自动化（CUA）解决方案，专为苹果M系列芯片（M4 Pro/Max/Ultra及以上）边缘设备优化，实现完全本地推理、零数据上传、高安全性的电脑自主操作。
 该模型以“AI for Personal”为核心理念，打破传统云端AI依赖API、数据隐私风险高的痛点，让用户在Mac mini、MacBook等设备上即可运行具备复杂界面理解、长任务规划、自主执行与结果验证的全链路智能体，在OSWorld、ScreenSpot-V2、MMBench等全球权威GUI智能体基准测试中斩获多项SOTA，其中OSWorld专用模型成功率达58.2%，位列全球第一。
 Mano-P 1.0采用分阶段开源策略，当前已开放Mano-CUA Skills组件，支持与OpenClaw、Claude Code等生态集成，后续将逐步开源本地侧模型、SDK、训练方案与量化技术，面向开发者、企业IT团队、个人效率用户提供可定制、可私有化部署的GUI智能体能力。
 Mano-P 1.0基于明略科技Mano技术栈构建，采用三阶段渐进式训练+双向自强化学习技术路线： 
  
    
    
      基准测试 核心指标 Mano-P 1.0-72B 行业地位 OSWorld 专用模型成功率 58.2% 全球第一 ScreenSpot-V2 界面定位准确率 93.5% SOTA MMBench 多模态理解 87.5% 第一梯队 WebRetriever NavEval得分 41.7 超越Gemini 2.5 Pro/Claude 4.5 
    
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
brew install python3
pip install mlx mlx-lm
git clone https://github.com/Mininglamp-AI/Mano-P.git

cd Mano-P

pip install -r requirements.txt

# config.py MODEL_PATH = "./mano-p-4b-w4a16" DEVICE = "mps"

python main.py –task "打开浏览器并搜索Mano-P项目"

python main.py –task "整理桌面文件，按类型分类到对应文件夹"

python skill_runner.py –skill report –data "./data.xlsx"

未配置本地模型时，可临时使用明略官方推理接口，本地仅传输截图与任务描述，文件与隐私数据仍保留在设备：

python main.py --mode cloud --api-key "your-key"

对比维度 Mano-P 1.0 Claude Computer Use Gemini 3.1 Pro Computer Use 部署方式全本地开源云端API 云端API OSWorld成绩 58.2%（专用模型第一） 72.7%（通用模型）约60%（通用模型）数据隐私零上传，本地闭环数据上传Anthropic服务器数据上传Google服务器硬件要求 M4+，32GB内存无，仅需网络无，仅需网络开源程度全开源（Apache 2.0）闭源，无定制能力闭源，无定制能力推理速度本地76 tokens/s 依赖网络延迟依赖网络延迟适用场景个人/企业私有化、涉密场景通用轻量任务通用多模态任务二次开发支持SDK、技能扩展不支持有限支持

Mano-P 1.0支持Windows或Linux系统吗？

当前版本仅针对苹果M系列芯片macOS系统优化，暂不支持Windows与Linux，官方未公布跨平台适配时间表。

Mano-P 1.0最低硬件配置是什么？

推荐M4 Pro及以上芯片，32GB统一内存；16GB内存设备可运行4B量化模型，但会出现明显卡顿，不建议用于生产环境。

运行Mano-P需要付费吗？

项目基于Apache 2.0开源协议，个人与商业使用均免费，无授权费用，模型文件可从官方渠道免费下载。

Mano-P执行错误任务怎么办？

模型内置Think-Act-Verify机制，会自动校验结果并重试；仍失败可通过自然语言重新描述任务，或调整任务拆解粒度。

可以自己训练定制版Mano-P模型吗？

项目第三阶段将开源训练代码、数据集与量化方案，届时开发者可基于行业数据微调专属模型，当前仅支持技能组件定制。

Mano-P与OpenClaw、Claude Code如何集成？

已开源Mano-CUA Skills组件，通过Python接口直接对接，可将Mano-P的GUI操作能力注入现有Agent工作流，提升自动化深度。

本地推理时发热与功耗如何？

4B量化模型在M4 Pro上运行功耗约15-20W，发热控制良好，适合长时间办公使用；72B模型功耗较高，建议外接电源使用。

Mano-P 1.0是明略科技推出的全球领先端侧GUI-VLA智能体模型，以全本地运行、数据隐私安全、高性能推理与开源可定制为核心优势，在OSWorld等权威基准测试中斩获专用模型第一，能够自主完成复杂电脑操作、长流程任务执行与跨系统数据整合，既满足个人用户提升办公与日常效率的需求，也为企业提供私有化、可定制的计算机使用自动化解决方案，依托Apache 2.0开源协议与完整技术生态，降低了GUI智能体的落地门槛，成为端侧AI自动化领域的标杆级开源项目。

2026年Mano-P 1.0：明略科技开源的端侧GUI-VLA智能体，自主完成复杂电脑操作

相关推荐