“让AI帮你刷短视频、点外卖、回消息”——这听起来像是科幻电影里的场景,但今天,通过智谱AI开源的Open-AutoGLM,你的安卓手机就能免费拥有这个能力。
Open-AutoGLM,或者说它的手机端框架AutoGLM-Phone,是一个能“看懂”手机屏幕并“动手”操作的AI智能体。你只需要用说话的方式告诉它“打开小红书搜美食”,它就能自己规划步骤、点击屏幕,一步步完成任务。这不再是概念演示,而是一个可以亲手部署的开源项目。
本教程将带你从零开始,用最简单的方式,在5分钟内完成本地环境的搭建,让你的手机初步具备AI助理的雏形。我们聚焦于最核心、最快速的部署路径,避开复杂的云端模型部署,让你先体验起来。
在让AI接管手机之前,我们需要搭建一个沟通桥梁。这个桥梁就是ADB(Android Debug Bridge),它能让你的电脑通过USB或WiFi控制手机。
1.1 电脑端:安装ADB工具
首先,在你的电脑(Windows或macOS)上安装ADB工具。
对于Windows用户:
- 下载ADB工具包:访问安卓开发者官网或使用搜索引擎查找“platform-tools最新版下载”,下载ZIP压缩包。
- 解压并配置环境变量:
- 将下载的
platform-tools文件夹解压到一个容易找到的路径,例如C:adb。 - 右键点击“此电脑” -> “属性” -> “高级系统设置” -> “环境变量”。
- 在“系统变量”中找到并选中
Path,点击“编辑”。 - 点击“新建”,将你解压的
platform-tools文件夹的完整路径(如C:adbplatform-tools)添加进去。 - 点击“确定”保存所有设置。
- 将下载的
- 验证安装:打开命令提示符(CMD)或PowerShell,输入
adb version并回车。如果显示ADB的版本号,说明配置成功。
对于macOS用户: 更简单,通常使用Homebrew一键安装:
brew install android-platform-tools
安装后,在终端(Terminal)输入 adb version 验证。
1.2 手机端:开启调试权限
接下来,我们需要在安卓手机上开启几个关键开关,允许电脑控制它。
- 开启开发者模式:
- 打开手机“设置”,找到“关于手机”或“我的设备”。
- 连续点击“版本号”7次,直到屏幕提示“您已处于开发者模式”。
- 开启USB调试:
- 返回“设置”,现在你应该能看到新增的“开发者选项”或“系统开发者选项”。
- 进入“开发者选项”,找到“USB调试”并打开它。手机会弹出风险提示,选择“确定”。
- 安装ADB键盘(关键一步):
- 为了让AI能模拟键盘输入文字,我们需要一个特殊的输入法。在手机浏览器中搜索并下载
ADB Keyboard的APK安装文件。 - 安装完成后,进入手机“设置” -> “系统” -> “语言与输入法” -> “虚拟键盘”或“默认键盘”。
- 将默认输入法切换为刚刚安装的
ADB Keyboard。
- 为了让AI能模拟键盘输入文字,我们需要一个特殊的输入法。在手机浏览器中搜索并下载
AI的“思考”部分(大模型)部署在云端或本地服务器上比较复杂。为了让教程更聚焦,我们先完成本地“控制端”的部署,它负责接收AI的指令并转化为手机操作。
控制端就是Open-AutoGLM的项目代码,我们把它下载到电脑上。
- 克隆项目代码:打开电脑的命令行工具(CMD、PowerShell或终端),执行以下命令:
GPT plus 代充 只需 145
git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM这会把项目代码下载到当前目录下的
Open-AutoGLM文件夹中。 - 安装Python依赖:该项目基于Python,我们需要安装必要的库。
pip install -r requirements.txt pip install -e .请确保你的电脑已安装Python 3.10或更高版本。
现在,用USB数据线将手机连接到电脑。在电脑命令行中执行:
GPT plus 代充 只需 145adb devices
你会看到类似以下的输出:
List of devices attached abcdef device
这串abcdef就是你的设备ID,说明连接成功。如果显示unauthorized,请在手机弹出的“允许USB调试吗?”对话框中点击“确定”。
进阶:WiFi连接(可选) 如果你想摆脱线缆,可以设置WiFi连接:
GPT plus 代充 只需 145# 1. 先用USB线执行一次,开启网络调试端口 adb tcpip 5555 # 2. 断开USB线,查看手机IP地址(通常在设置-关于手机-状态信息中) # 3. 使用手机IP进行连接,假设手机IP是192.168.1.100 adb connect 192.168.1.100:5555
再次执行 adb devices,你会看到设备以IP地址的形式列出。
一切就绪!现在,我们尝试运行一个最简单的例子。由于完整的AI模型部署在云端,为了让你立刻看到效果,我们可以先使用项目提供的“演示模式”或一个极简的模拟指令来测试控制链路是否通畅。
在 Open-AutoGLM 目录下,运行一个测试脚本(如果项目提供)或使用以下简化思路:
实际上,Open-AutoGLM的设计是与云端模型服务联动的。但为了验证本地环境,你可以先尝试执行一个不依赖云端模型的简单ADB命令测试:
# 通过ADB命令让手机亮屏并解锁(假设密码为1234,请替换为你的密码) adb shell input keyevent 26 # 点亮屏幕 adb shell input swipe 300 1000 300 500 # 模拟上滑解锁(坐标需根据手机调整) adb shell input text 1234 # 输入密码 adb shell input keyevent 66 # 模拟回车键确认
如果手机屏幕亮起并尝试解锁,说明你的ADB控制链路完全正常,已经具备了被AI操控的基础。
要体验完整的AI智能体,你需要一个运行着 autoglm-phone-9b 模型的云端服务。假设你已经在一台云服务器上部署好了服务(部署方法涉及vLLM等,较为复杂,本教程不展开),其API地址为 http://你的服务器IP:8800/v1,那么完整的启动命令如下:
GPT plus 代充 只需 145python main.py --device-id abcdef # 替换为你的设备ID --base-url http://你的服务器IP:8800/v1 --model "autoglm-phone-9b" "打开抖音,搜索用户‘科技美学’并关注"
AI会开始“观察”屏幕,规划点击“抖音”图标、进入搜索框、输入文字、点击关注等一系列操作。
通过以上步骤,你已经成功搭建了让AI控制手机的硬件与软件环境。我们完成了最关键的几步:
- 环境打通:在电脑和手机上配置好了ADB调试通道。
- 控制端就绪:本地部署了Open-AutoGLM的控制代码。
- 连接验证:确保了电脑可以可靠地向手机发送点击、滑动、输入等指令。
这相当于为你的手机安装了一个“机械手”,并且接上了“神经”。目前,这个“机械手”还缺少一个“大脑”(即云端的大模型)来指挥它。本教程旨在用最短路径让你看到可能性,并验证基础环境。
接下来的探索方向:
- 部署AI模型:在本地或云服务器上部署智谱的
autoglm-phone-9b模型,这是最具挑战性但也最核心的一步,需要一定的GPU资源和技术知识。 - 尝试更多指令:从简单的“打开设置”到复杂的“帮我点一份附近评分最高的奶茶外卖”,探索AI助理能力的边界。
- 理解原理:深入研究Open-AutoGLM如何结合视觉识别(看懂屏幕)和规划决策(下一步点哪里)来完成任务的。
Open-AutoGLM的开源,降低了普通人体验系统级AI Agent的门槛。虽然完整的部署仍有技术挑战,但亲手搭建并见证一个指令让手机自动运行的过程,无疑是通往未来人机交互方式的一次有趣实践。现在,你的手机已经准备好了,只等那个“大脑”发出指令。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/245126.html