2026年原创还拿不到Manus邀请码？试试这几款开箱即用的computer use智能体，附教程

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。
 
  
    
     
     还拿不到Manus邀请码?来体验这几款computer use 智能体 
     无需等待Manus邀请码，即刻体验这5款computer use智能体 
     Manus智能体邀请码难到手？试试这些能够操作电脑的的AI Agent 
     Manus邀请码遥不可及？这些电脑使用智能体值得一试 
     Manus智能体并非唯一选择，试试这些电脑使用AI Agent 
     拿不到Manus邀请码？试试这些computer use智能体 
    
 文/王吉伟
我在今年1月初写了2025年的AI Agent发展十三大趋势，其中两个趋势是多Agent系统开始流行和GUI Agent产品得到更多应用，没想到来得这么快。
推荐阅读：智能体商用元年开启，2025年AI Agent行业发展十三大趋势
最近几天，集多Agent架构、computer use、GUI智能体等技术和概念于一身的Manus，通过一些媒体、科技博主的报道和渲染，在 “比肩DeepSeek” “AI Agent 的GPT时刻” 等一浪强过一浪的声浪中，Manus一夜出圈。 
官方资料显示，Manus通过多Agent架构（Multiple Agent）将任务拆分为规划、执行、验证等子模块，每个Agent基于独立的语言模型或强化学习模型，通过API协同工作，最终在虚拟机中调用工具（如编写代码、爬取数据）完成任务。这些特性，是多智能体架构的通性。
这样的项目实现，对于不懂代码的可能很难。对于懂代码的来说，好吧，来自知名多Agent架构MetaGPT的3个小伙子仅用了3个小时就把Manus复现了。这个项目叫OpenManus，到这篇文章发布时已经有16.3k stars了。Manus的出圈以及短期内体验，间接捧红了这个同类型开源项目，泼天富贵就这样简单地转移了。
项目地址：https://github.com/mannaandpoem/OpenManus
当然快速复现Manus的团队不只一个，同样是知名多Agent架构的Camal团队也仅用了0天就复刻了Manus，这个项目叫作owl，目前也有4K stars了。
项目地址：https://github.com/camel-ai/owl
也就在这几天之内，已经出现了多个复刻Manus的开源项目。3月这才刚开始，多智能体架构、computer use、GUI智能体的概念就彻底爆发了。
再说回Manus。
在应用场景方面，Manus覆盖旅行规划、股票分析、教育内容生成等40余个领域。这么多场景任务都能实现，再加上自主执行的能力，当真是媲美钢铁侠的“贾维斯”助手了。这样的噱头，想不吸引人都难。
所以，其核心卖点在放在了“自主执行”能力上与场景通用上。
Manus的核心架构与Anthropic的“Computer Use”高度相似，依赖多Agent虚拟机环境完成任务。“自主规划”能力则基于现有大语言模型（如GPT-4）的调用，很有可能在任务规划模型上也用了DeepSeek，可以大大降低成本。
因为Manus没有自研基础大模型，而是通过整合OpenAI的GPT-4、Anthropic 的Claude等第三方模型实现功能，其核心架构被定义为「虚拟机+多模型协同」的封装模式‌。这种做法，也就是业界所谓的“套壳”。
有业内人士直言，Manus的核心能力，如任务拆解其实与Devin、Cursor等现有产品相似，其创新更多体现在工程封装而非底层技术突破。
Manus号称全球首款通用AI Agent，对于此只能说智者见智了。通用AI Agent意味着多场景匹配、跨场景应用 多智能体协作乃至跨平台应用，背后需要强大算力和稳定网络的支撑，需要多重模型的综合应用，更需要对高并发支持。
LLM Based Agent，性能和功能取决于LLM的能力，理论上当前的大语言模型可以支撑通用AI Agent实现，但在任务执行时间 任务完成度上对用户体验是很大的考验，一个复杂的任务可能会需要很长时间，一些用户的体验记录也证实了这一点。
更长的任务执行时间，意味着更多token的消耗。面对一个动辄需要数十分钟才能完成任务，token消耗会是一个无底洞，也就意味着更高的成本，这样的性价比估计也只有特殊需求的企业能考虑了。至于有些视频说的提交了任务明天等着任务完成，不怕烧钱的用户当然也是没问题的。
性价比与成效比，决定了很多大厂至今也没有打出通用AI Agent的旗号，还是主要在攻击垂直智能体，这也是近几年智能体的主要发展方向。 让人有些不爽的是，一边轰轰烈烈的宣传，一边却疑似却搞起了饥饿营销。现在，邀请码仍一码难求，当然也给了很多人炒作邀请码的机会，商机无处不在。
邀请码一码难求的原因，或许是申请的人太多，也有可能是根本不想放码。不放邀请码的好处是体验的人少负面评论少挨骂就少，坏处是因为大家体验不到挨骂也不少。据说，就连一些力捧Mannus的AI大V和公知也有塌房的风险。
当然更有可能是官方目前购买的算力无法支撑这么多人同时体验，毕竟高并发需要大算力和强网络。 
不过也没有关系，既然还拿不到邀请码体验不了Manus，我们可以体验几个同类产品和项目。这里，王吉伟频道就为大家介绍几款computer use、GUI的开源项目。除了最后一个，都是开箱即用的。
1、Goole AI Studio
Google AI Studio 是一个集成了多种 AI 功能且易于使用的 AI 开发平台，专注于简化 AI 模型的创建、优化和部署流程。它旨在降低 AI 开发的门槛，使开发者无需深厚的机器学习背景也能快速上手，同时为专业开发者提供强大的工具支持，以满足复杂项目的需求，快速实现 AI 驱动的创新项目。
想要在Google AI Studio体验与程序互动很简单，只需要点击页面左上角的实时流，右面设置栏模型默认Gemini 2.0 Flash，输出格式选择文本或者语音。
选择想用的工具，再点击页面中下部的 共享屏幕 ，选择与窗口、浏览器标签页或者整个屏幕活动，就可以进行交互了。
这里我选了一个名为 AI Agent的GPT时刻的浏览器标签页，并询问Manus是什么，截图如下。事实证明，语言交互体验更好一些。
同样大家还可以选择与Gemini实时对话，或者与Gemini交流通过摄像头观察到的各种实物，未来应用非常有想象空间。
在入门应用程序中还有一个视频分析器，怎么使用待大家自行探索。
对于一个相对成熟的网页端AI应用，应用起来并不难，大家可以自行体验，这里就不多做介绍了。当然对于开发人员，Google AI Studio 还可以开发出更多功能。
这个产品最大的痛点是需要科学上网，相信聪明如你一定能解决这个问题。实在不方便的朋友，可以选择体验后面的几个项目。
体验地址：https://aistudio.google.com/prompts/new_chat
2、UI-TARS-desktop
UI-TARS Desktop 是由字节跳动开发的一款基于 UI-TARS（视觉 - 语言模型）的 GUI Agent应用程序，它允许用户通过自然语言控制计算机。
该应用支持跨平台（Windows/MacOS）、实时反馈、本地处理等特性，还提供云部署和本地部署指南。用户可通过自然语言指令完成截图、鼠标键盘操作等任务，其模型有多种大小可供选择，以适应不同硬件配置。该项目在Github，目前已经有3K star。
项目地址：https://github.com/bytedance/UI-TARS-desktop
这个项目提供了安装程序，用户可从项目发布页面下载最新版本，MacOS系统和Windows系统都适用。
使用起来也很简单，在下面的页面根据自己的系统情况下载最新的0.06版本，安装玩打开软件程序。软件长这样，界面非常简洁，很难跟智能体联系到一块。
下载页面：https://github.com/bytedance/UI-TARS-desktop/releases/tag/v0.0.6
当然，我也为不能下载的小伙伴准备了安装包，后台回复 0307 获取。
想要体验操控电脑的关键，是要调用字节开发的视觉语言模型UI-TARS。部署该模型有两种方式，云部署和本地部署。 
  
    
     
     云部署 ：推荐使用 HuggingFace 推理端点进行快速部署，提供了英文和中文的部署指南。 
     本地部署 [vLLM] ：推荐使用 vLLM 进行快速部署和推理，需安装 vllm>=0.6.1。项目提供了不同大小的模型供用户根据硬件配置选择，并给出了启动 OpenAI 兼容 API 服务的命令。 
    
本地部署对于没有代码基础的朋友有些麻烦，这里我们选择云部署。官方在Hugging Face 上提供了三种型号尺寸：2B、7B 和 72B。为了实现**性能，建议使用 7B-DPO 或 72B-DPO 型号（根据您的硬件配置）。
对于云部署，官方目前提供了火山引擎部署、魔搭部署和Huggingface Inference Endpoints云部署三种，都需要充点小钱。考虑网络速度、稳定性以及充值方式，Huggingface被排除。剩下的两个国内云厂商，因为阿里云早有账户就选了阿里云。这里以UI-TARS-7B-DPO为例，教大家怎么通过魔搭进入阿里云PAI入口部署该模型。
通过下面网址，进入魔搭的模型信息界面。目前新用户注册，限时赠送100小时免费GPU算力，包含100小时32GB显存GPU+长期免费CPU计算资源（不是广告）。
https://www.modelscope.cn/models/bytedance-research/UI-TARS-7B-DPO
鼠标划到该页面右上方的 部署 按钮，点击弹出的菜单，会进入阿里云PAI平台的该模型界面，并自动进入UI-TARS-7B-DPO模型的部署页面，页面右半部分是部署操作菜单。如果没有弹出部署菜单，点击页面右上角的部署按钮。记得在页面左上角，确认是不是要部署的模型。
模型部署页面都保持默认就行，默认是一台30G的Nvidia A10显卡云主机。我们要做的，就是在这台云主机上部署UI-TARS-7B-DPO模型。最后点击模型部署页面左下角的部署按钮。进入部署页面，等待几分钟。
点击页面左侧 模型部署 下的 模型在线服务，右面主体部分就会显示你已经部署好的主机。如果账户有钱，主机会处于启动状态。
这台服务器机型，目前的费用是10.5元/小时，体验完记得停止，不然会一直消费。我充了50元，但体验完忘了关机，今天已经因为欠费而停机。
阿里云充值页面，如下：
https://billing-cost.console.aliyun.com/fortune/fund-management/recharge
下面说一下如何在UI-TARS-desktop调用UI-TARS模型。点击 模型在线服务 页面的你所部署主机的调用信息，会弹出调用信息的详细页面。
打开UI-TARS-desktop软件程序，点击右上角的 齿轮 按钮，弹出模型设置窗口。
语言选中文，VLM Provider选vLLM。VLM Base URL一栏，填云主机的访问地址。VLM API Key一栏，填写云主机的Token密码。VLM Model Namet填写模型名称UI-TARS-7B-DPO。其他选项，保持默认。
点击左下角的 Save 按钮，保存模型信息。关闭软件，再次打开（这点很重要），就可以使用了。下面放两个官方案例视频，大家可以试着复现一下。
至于更多的玩法，就交给大家去探索了。
3、midscene
项目地址：https://github.com/web-infra-dev/midscene?tab=readme-ov-file 
  
    
    
https://bailian.console.aliyun.com/
https://chromewebstore.google.com/detail/midscenejs/gbldofcpkknbggpkmbdaefngejllnief
OPENAI_BASE_URL="https://dashscope.aliyuncs.com/compatible-mode/v1" 
OPENAI_API_KEY="你的API-KEY" 
MIDSCENE_MODEL_NAME="qwen2.5-vl-72b-instruct" 
MIDSCENE_USE_VLM_UI_TARS=1
OPENAI_BASE_URL="你的访问地址/v1" 
OPENAI_API_KEY="你的token密码" 
MIDSCENE_MODEL_NAME="UI-TARS-7B-DPO" 
MIDSCENE_USE_VLM_UI_TARS=1 
  
    
    
4、智谱GLM-PC
下载：https://cogagent.aminer.cn/home#/downloads
教学视频：https://zhipu-ai.feishu.cn/docx/PVEdd0C6yoZJl5xevsRcupYtnvg
申请体验：https://www.wjx.cn/vm/YtHMOrW.aspx#
先体验急速模式，打开小红书，登录账号。在GLM-PC的对话框指派任务，输入指令：
打开这个网址「11 【2024款小米su7落地价与配置参考 - 漂亮妹妹 | 小红书 - 你的生活指南】 😆 zd6bLT3R0aC1cgY 😆 https://www.xiaohongshu.com/discovery/item/d0000000024019e5a?source=webshare&xhsshare=pc_web&xsec_token=ABsV-IYvSAwtUlCA_lC0SCYnEhX-KO0eZCpFloefapQrE=&xsec_source=pc_share 」，把这个视频的账号昵称、点赞、收藏、评论数据，保存到新建Excel表中，保存命名为“小红书数据”
再来复现一个案例。还是在深度思考模式下，输入以下指令：
在这个「https://www.dxsbb.com/news/277.html」六级词汇里面找3个，然后把给每个词造句，把词汇和对应的造句粘贴到新建Word文档中，保存命名为“六级英语词汇学习"
5、Open Manus
conda create -n open_manus python=3.12
conda activate open_manus
git clone https://github.com/mannaandpoem/OpenManus.git
cd OpenManus
pip install -r requirements.txt
配置
cp config/config.example.toml config/config.toml
# 全局 LLM 配置
[llm]
model = "gpt-4o"
base_url = "https://api.openai.com/v1"
api_key = "sk-..." # 替换为真实 API 密钥
max_tokens = 4096
temperature = 0.0
# 可选特定 LLM 模型配置
[llm.vision]
model = "gpt-4o"
base_url = "https://api.openai.com/v1"
api_key = "sk-..." # 替换为真实 API 密钥
快速启动
python main.py
python run_flow.py
后记：让子弹再飞一会儿
【王吉伟频道，关注AIGC与IoT，专注数字化转型、业务流程自动化与AI Agent，欢迎关注与交流。】
2026年原创还拿不到Manus邀请码？试试这几款开箱即用的computer use智能体，附教程

相关推荐