2026年Mano-P 1.0:明略科技开源的端侧GUI-VLA智能体,自主完成复杂电脑操作

Mano-P 1.0:明略科技开源的端侧GUI-VLA智能体,自主完成复杂电脑操作p strong Mano P 1 0 strong 是明略科技 Mininglamp AI 开源的 strong GUI VLA Vision Language Action 端侧智能体模型 strong 核心定位为面向个人与企业的 strong 本地计算机使用自动化 CUA 解决方案 lt strong p

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



 

Mano-P 1.0是明略科技(Mininglamp-AI)开源的GUI-VLA(Vision-Language-Action)端侧智能体模型,核心定位为面向个人与企业的本地计算机使用自动化(CUA)解决方案,专为苹果M系列芯片(M4 Pro/Max/Ultra及以上)边缘设备优化,实现完全本地推理、零数据上传、高安全性的电脑自主操作。

该模型以“AI for Personal”为核心理念,打破传统云端AI依赖API、数据隐私风险高的痛点,让用户在Mac mini、MacBook等设备上即可运行具备复杂界面理解、长任务规划、自主执行与结果验证的全链路智能体,在OSWorld、ScreenSpot-V2、MMBench等全球权威GUI智能体基准测试中斩获多项SOTA,其中OSWorld专用模型成功率达58.2%,位列全球第一。

Mano-P 1.0采用分阶段开源策略,当前已开放Mano-CUA Skills组件,支持与OpenClaw、Claude Code等生态集成,后续将逐步开源本地侧模型、SDK、训练方案与量化技术,面向开发者、企业IT团队、个人效率用户提供可定制、可私有化部署的GUI智能体能力。

Mano-P 1.0:明略科技开源的端侧GUI-VLA智能体,自主完成复杂电脑操作

Mano-P 1.0基于明略科技Mano技术栈构建,采用三阶段渐进式训练+双向自强化学习技术路线:

基准测试 核心指标 Mano-P 1.0-72B 行业地位 OSWorld 专用模型成功率 58.2% 全球第一 ScreenSpot-V2 界面定位准确率 93.5% SOTA MMBench 多模态理解 87.5% 第一梯队 WebRetriever NavEval得分 41.7 超越Gemini 2.5 Pro/Claude 4.5

Mano-P 1.0:明略科技开源的端侧GUI-VLA智能体,自主完成复杂电脑操作

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
brew install python3
pip install mlx mlx-lm
git clone https://github.com/Mininglamp-AI/Mano-P.git 

cd Mano-P

pip install -r requirements.txt
# config.py MODEL_PATH = "./mano-p-4b-w4a16" DEVICE = "mps"
python main.py –task "打开浏览器并搜索Mano-P项目"
python main.py –task "整理桌面文件,按类型分类到对应文件夹"
python skill_runner.py –skill report –data "./data.xlsx"

未配置本地模型时,可临时使用明略官方推理接口,本地仅传输截图与任务描述,文件与隐私数据仍保留在设备:

python main.py --mode cloud --api-key "your-key"
对比维度 Mano-P 1.0 Claude Computer Use Gemini 3.1 Pro Computer Use 部署方式 全本地开源 云端API 云端API OSWorld成绩 58.2%(专用模型第一) 72.7%(通用模型) 约60%(通用模型) 数据隐私 零上传,本地闭环 数据上传Anthropic服务器 数据上传Google服务器 硬件要求 M4+,32GB内存 无,仅需网络 无,仅需网络 开源程度 全开源(Apache 2.0) 闭源,无定制能力 闭源,无定制能力 推理速度 本地76 tokens/s 依赖网络延迟 依赖网络延迟 适用场景 个人/企业私有化、涉密场景 通用轻量任务 通用多模态任务 二次开发 支持SDK、技能扩展 不支持 有限支持

Mano-P 1.0支持Windows或Linux系统吗?

当前版本仅针对苹果M系列芯片macOS系统优化,暂不支持Windows与Linux,官方未公布跨平台适配时间表。

Mano-P 1.0最低硬件配置是什么?

推荐M4 Pro及以上芯片,32GB统一内存;16GB内存设备可运行4B量化模型,但会出现明显卡顿,不建议用于生产环境。

运行Mano-P需要付费吗?

项目基于Apache 2.0开源协议,个人与商业使用均免费,无授权费用,模型文件可从官方渠道免费下载。

Mano-P执行错误任务怎么办?

模型内置Think-Act-Verify机制,会自动校验结果并重试;仍失败可通过自然语言重新描述任务,或调整任务拆解粒度。

可以自己训练定制版Mano-P模型吗?

项目第三阶段将开源训练代码、数据集与量化方案,届时开发者可基于行业数据微调专属模型,当前仅支持技能组件定制。

Mano-P与OpenClaw、Claude Code如何集成?

已开源Mano-CUA Skills组件,通过Python接口直接对接,可将Mano-P的GUI操作能力注入现有Agent工作流,提升自动化深度。

本地推理时发热与功耗如何?

4B量化模型在M4 Pro上运行功耗约15-20W,发热控制良好,适合长时间办公使用;72B模型功耗较高,建议外接电源使用。

Mano-P 1.0是明略科技推出的全球领先端侧GUI-VLA智能体模型,以全本地运行、数据隐私安全、高性能推理与开源可定制为核心优势,在OSWorld等权威基准测试中斩获专用模型第一,能够自主完成复杂电脑操作、长流程任务执行与跨系统数据整合,既满足个人用户提升办公与日常效率的需求,也为企业提供私有化、可定制的计算机使用自动化解决方案,依托Apache 2.0开源协议与完整技术生态,降低了GUI智能体的落地门槛,成为端侧AI自动化领域的标杆级开源项目。

小讯
上一篇 2026-04-20 22:41
下一篇 2026-04-20 22:39

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/265061.html