2026年原创还拿不到Manus邀请码?试试这几款开箱即用的computer use智能体,附教程

原创还拿不到Manus邀请码?试试这几款开箱即用的computer use智能体,附教程ul li 还拿不到 Manus 邀请码 来体验这几款 computer use 智能体 li li 无需等待 Manus 邀请码 即刻体验这 5 款 computer use 智能体 li li Manus 智能体邀请码难到手 试试这些能够操作电脑的的 AI Agent li ul

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



 
  
    
    
  • 还拿不到Manus邀请码?来体验这几款computer use 智能体
  • 无需等待Manus邀请码,即刻体验这5款computer use智能体
  • Manus智能体邀请码难到手?试试这些能够操作电脑的的AI Agent
  • Manus邀请码遥不可及?这些电脑使用智能体值得一试
  • Manus智能体并非唯一选择,试试这些电脑使用AI Agent
  • 拿不到Manus邀请码?试试这些computer use智能体

文/王吉伟

我在今年1月初写了2025年的AI Agent发展十三大趋势,其中两个趋势是多Agent系统开始流行和GUI Agent产品得到更多应用,没想到来得这么快。

推荐阅读:智能体商用元年开启,2025年AI Agent行业发展十三大趋势

最近几天,集多Agent架构、computer use、GUI智能体等技术和概念于一身的Manus,通过一些媒体、科技博主的报道和渲染,在 “比肩DeepSeek” “AI Agent 的GPT时刻” 等一浪强过一浪的声浪中,Manus一夜出圈。

官方资料显示,Manus通过多Agent架构(Multiple Agent)将任务拆分为规划、执行、验证等子模块,每个Agent基于独立的语言模型或强化学习模型,通过API协同工作,最终在虚拟机中调用工具(如编写代码、爬取数据)完成任务。这些特性,是多智能体架构的通性。

这样的项目实现,对于不懂代码的可能很难。对于懂代码的来说,好吧,来自知名多Agent架构MetaGPT的3个小伙子仅用了3个小时就把Manus复现了。这个项目叫OpenManus,到这篇文章发布时已经有16.3k stars了。Manus的出圈以及短期内体验,间接捧红了这个同类型开源项目,泼天富贵就这样简单地转移了。

项目地址:https://github.com/mannaandpoem/OpenManus

当然快速复现Manus的团队不只一个,同样是知名多Agent架构的Camal团队也仅用了0天就复刻了Manus,这个项目叫作owl,目前也有4K stars了。

项目地址:https://github.com/camel-ai/owl

也就在这几天之内,已经出现了多个复刻Manus的开源项目。3月这才刚开始,多智能体架构、computer use、GUI智能体的概念就彻底爆发了。

再说回Manus。

在应用场景方面,Manus覆盖旅行规划、股票分析、教育内容生成等40余个领域。这么多场景任务都能实现,再加上自主执行的能力,当真是媲美钢铁侠的“贾维斯”助手了。这样的噱头,想不吸引人都难。

所以,其核心卖点在放在了“自主执行”能力上与场景通用上。

Manus的核心架构与Anthropic的“Computer Use”高度相似,依赖多Agent虚拟机环境完成任务。“自主规划”能力则基于现有大语言模型(如GPT-4)的调用,很有可能在任务规划模型上也用了DeepSeek,可以大大降低成本。

因为Manus没有自研基础大模型,而是通过整合OpenAI的GPT-4、Anthropic 的Claude等第三方模型实现功能,其核心架构被定义为「虚拟机+多模型协同」的封装模式‌。这种做法,也就是业界所谓的“套壳”。

有业内人士直言,Manus的核心能力,如任务拆解其实与Devin、Cursor等现有产品相似,其创新更多体现在工程封装而非底层技术突破。

Manus号称全球首款通用AI Agent,对于此只能说智者见智了。通用AI Agent意味着多场景匹配、跨场景应用 多智能体协作乃至跨平台应用,背后需要强大算力和稳定网络的支撑,需要多重模型的综合应用,更需要对高并发支持。

LLM Based Agent,性能和功能取决于LLM的能力,理论上当前的大语言模型可以支撑通用AI Agent实现,但在任务执行时间 任务完成度上对用户体验是很大的考验,一个复杂的任务可能会需要很长时间,一些用户的体验记录也证实了这一点。

更长的任务执行时间,意味着更多token的消耗。面对一个动辄需要数十分钟才能完成任务,token消耗会是一个无底洞,也就意味着更高的成本,这样的性价比估计也只有特殊需求的企业能考虑了。至于有些视频说的提交了任务明天等着任务完成,不怕烧钱的用户当然也是没问题的。

性价比与成效比,决定了很多大厂至今也没有打出通用AI Agent的旗号,还是主要在攻击垂直智能体,这也是近几年智能体的主要发展方向。 让人有些不爽的是,一边轰轰烈烈的宣传,一边却疑似却搞起了饥饿营销。现在,邀请码仍一码难求,当然也给了很多人炒作邀请码的机会,商机无处不在。

邀请码一码难求的原因,或许是申请的人太多,也有可能是根本不想放码。不放邀请码的好处是体验的人少负面评论少挨骂就少,坏处是因为大家体验不到挨骂也不少。据说,就连一些力捧Mannus的AI大V和公知也有塌房的风险。

当然更有可能是官方目前购买的算力无法支撑这么多人同时体验,毕竟高并发需要大算力和强网络。

不过也没有关系,既然还拿不到邀请码体验不了Manus,我们可以体验几个同类产品和项目。这里,王吉伟频道就为大家介绍几款computer use、GUI的开源项目。除了最后一个,都是开箱即用的。

1、Goole AI Studio

Google AI Studio 是一个集成了多种 AI 功能且易于使用的 AI 开发平台,专注于简化 AI 模型的创建、优化和部署流程。它旨在降低 AI 开发的门槛,使开发者无需深厚的机器学习背景也能快速上手,同时为专业开发者提供强大的工具支持,以满足复杂项目的需求,快速实现 AI 驱动的创新项目。

想要在Google AI Studio体验与程序互动很简单,只需要点击页面左上角的实时流,右面设置栏模型默认Gemini 2.0 Flash,输出格式选择文本或者语音。

选择想用的工具,再点击页面中下部的 共享屏幕 ,选择与窗口、浏览器标签页或者整个屏幕活动,就可以进行交互了。

这里我选了一个名为 AI Agent的GPT时刻的浏览器标签页,并询问Manus是什么,截图如下。事实证明,语言交互体验更好一些。

同样大家还可以选择与Gemini实时对话,或者与Gemini交流通过摄像头观察到的各种实物,未来应用非常有想象空间。

在入门应用程序中还有一个视频分析器,怎么使用待大家自行探索。

对于一个相对成熟的网页端AI应用,应用起来并不难,大家可以自行体验,这里就不多做介绍了。当然对于开发人员,Google AI Studio 还可以开发出更多功能。

这个产品最大的痛点是需要科学上网,相信聪明如你一定能解决这个问题。实在不方便的朋友,可以选择体验后面的几个项目。

体验地址:https://aistudio.google.com/prompts/new_chat

2、UI-TARS-desktop

UI-TARS Desktop 是由字节跳动开发的一款基于 UI-TARS(视觉 - 语言模型)的 GUI Agent应用程序,它允许用户通过自然语言控制计算机。

该应用支持跨平台(Windows/MacOS)、实时反馈、本地处理等特性,还提供云部署和本地部署指南。用户可通过自然语言指令完成截图、鼠标键盘操作等任务,其模型有多种大小可供选择,以适应不同硬件配置。该项目在Github,目前已经有3K star。

项目地址:https://github.com/bytedance/UI-TARS-desktop

这个项目提供了安装程序,用户可从项目发布页面下载最新版本,MacOS系统和Windows系统都适用。

使用起来也很简单,在下面的页面根据自己的系统情况下载最新的0.06版本,安装玩打开软件程序。软件长这样,界面非常简洁,很难跟智能体联系到一块。

下载页面:https://github.com/bytedance/UI-TARS-desktop/releases/tag/v0.0.6

当然,我也为不能下载的小伙伴准备了安装包,后台回复 0307 获取。

想要体验操控电脑的关键,是要调用字节开发的视觉语言模型UI-TARS。部署该模型有两种方式,云部署和本地部署。

  • 云部署 :推荐使用 HuggingFace 推理端点进行快速部署,提供了英文和中文的部署指南。
  • 本地部署 [vLLM] :推荐使用 vLLM 进行快速部署和推理,需安装 vllm>=0.6.1。项目提供了不同大小的模型供用户根据硬件配置选择,并给出了启动 OpenAI 兼容 API 服务的命令。

本地部署对于没有代码基础的朋友有些麻烦,这里我们选择云部署。官方在Hugging Face 上提供了三种型号尺寸:2B、7B 和 72B。为了实现**性能,建议使用 7B-DPO 或 72B-DPO 型号(根据您的硬件配置)。

对于云部署,官方目前提供了火山引擎部署、魔搭部署和Huggingface Inference Endpoints云部署三种,都需要充点小钱。考虑网络速度、稳定性以及充值方式,Huggingface被排除。剩下的两个国内云厂商,因为阿里云早有账户就选了阿里云。这里以UI-TARS-7B-DPO为例,教大家怎么通过魔搭进入阿里云PAI入口部署该模型。

通过下面网址,进入魔搭的模型信息界面。目前新用户注册,限时赠送100小时免费GPU算力,包含100小时32GB显存GPU+长期免费CPU计算资源(不是广告)。

https://www.modelscope.cn/models/bytedance-research/UI-TARS-7B-DPO

鼠标划到该页面右上方的 部署 按钮,点击弹出的菜单,会进入阿里云PAI平台的该模型界面,并自动进入UI-TARS-7B-DPO模型的部署页面,页面右半部分是部署操作菜单。如果没有弹出部署菜单,点击页面右上角的部署按钮。记得在页面左上角,确认是不是要部署的模型。

模型部署页面都保持默认就行,默认是一台30G的Nvidia A10显卡云主机。我们要做的,就是在这台云主机上部署UI-TARS-7B-DPO模型。最后点击模型部署页面左下角的部署按钮。进入部署页面,等待几分钟。

点击页面左侧 模型部署 下的 模型在线服务,右面主体部分就会显示你已经部署好的主机。如果账户有钱,主机会处于启动状态。

这台服务器机型,目前的费用是10.5元/小时,体验完记得停止,不然会一直消费。我充了50元,但体验完忘了关机,今天已经因为欠费而停机。

阿里云充值页面,如下:

https://billing-cost.console.aliyun.com/fortune/fund-management/recharge

下面说一下如何在UI-TARS-desktop调用UI-TARS模型。点击 模型在线服务 页面的你所部署主机的调用信息,会弹出调用信息的详细页面。

打开UI-TARS-desktop软件程序,点击右上角的 齿轮 按钮,弹出模型设置窗口。

语言选中文,VLM Provider选vLLM。VLM Base URL一栏,填云主机的访问地址。VLM API Key一栏,填写云主机的Token密码。VLM Model Namet填写模型名称UI-TARS-7B-DPO。其他选项,保持默认。

点击左下角的 Save 按钮,保存模型信息。关闭软件,再次打开(这点很重要),就可以使用了。下面放两个官方案例视频,大家可以试着复现一下。

至于更多的玩法,就交给大家去探索了。

3、midscene

项目地址:https://github.com/web-infra-dev/midscene?tab=readme-ov-file

    https://bailian.console.aliyun.com/

    https://chromewebstore.google.com/detail/midscenejs/gbldofcpkknbggpkmbdaefngejllnief

    OPENAI_BASE_URL="https://dashscope.aliyuncs.com/compatible-mode/v1"

    OPENAI_API_KEY="你的API-KEY"

    MIDSCENE_MODEL_NAME="qwen2.5-vl-72b-instruct"

    MIDSCENE_USE_VLM_UI_TARS=1

    OPENAI_BASE_URL="你的访问地址/v1"

    OPENAI_API_KEY="你的token密码"

    MIDSCENE_MODEL_NAME="UI-TARS-7B-DPO"

    MIDSCENE_USE_VLM_UI_TARS=1

      4、智谱GLM-PC

      下载:https://cogagent.aminer.cn/home#/downloads

      教学视频:https://zhipu-ai.feishu.cn/docx/PVEdd0C6yoZJl5xevsRcupYtnvg

      申请体验:https://www.wjx.cn/vm/YtHMOrW.aspx#

      先体验急速模式,打开小红书,登录账号。在GLM-PC的对话框指派任务,输入指令:

      打开这个网址「11 【2024款小米su7落地价与配置参考 - 漂亮妹妹 | 小红书 - 你的生活指南】 😆 zd6bLT3R0aC1cgY 😆 https://www.xiaohongshu.com/discovery/item/d0000000024019e5a?source=webshare&xhsshare=pc_web&xsec_token=ABsV-IYvSAwtUlCA_lC0SCYnEhX-KO0eZCpFloefapQrE=&xsec_source=pc_share 」,把这个视频的账号昵称、点赞、收藏、评论数据,保存到新建Excel表中,保存命名为“小红书数据”

      再来复现一个案例。还是在深度思考模式下,输入以下指令:

      在这个「https://www.dxsbb.com/news/277.html」六级词汇里面找3个,然后把给每个词造句,把词汇和对应的造句粘贴到新建Word文档中,保存命名为“六级英语词汇学习"

      5、Open Manus

      conda create -n open_manus python=3.12

      conda activate open_manus

      git clone https://github.com/mannaandpoem/OpenManus.git

      cd OpenManus

      pip install -r requirements.txt

      配置

      cp config/config.example.toml config/config.toml

      # 全局 LLM 配置

      [llm]

      model = "gpt-4o"

      base_url = "https://api.openai.com/v1"

      api_key = "sk-..." # 替换为真实 API 密钥

      max_tokens = 4096

      temperature = 0.0

      # 可选特定 LLM 模型配置

      [llm.vision]

      model = "gpt-4o"

      base_url = "https://api.openai.com/v1"

      api_key = "sk-..." # 替换为真实 API 密钥

      快速启动

      python main.py

      python run_flow.py

      后记:让子弹再飞一会儿

      【王吉伟频道,关注AIGC与IoT,专注数字化转型、业务流程自动化与AI Agent,欢迎关注与交流。】

      小讯
      上一篇 2026-04-23 09:48
      下一篇 2026-04-23 09:46

      相关推荐

      版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
      如需转载请保留出处:https://51itzy.com/kjqy/278340.html