“打开小红书搜北京美食攻略,收藏前3篇高赞笔记”
“用美团点一份少糖奶茶,选距离最近的商家”
“把Excel里的销售数据整理成PPT,发邮件给经理”
这些需要手动切换多个APP、一步步操作的繁琐任务,现在只需一句话就能让手机自动完成!
前阵子豆包手机火遍网络,动动嘴就能让手机完成各种任务,这看起来十分吸引人!豆包手机现在发售及售空,二手价格已经超过了首发价格!
那些想体验AI手机,但是又抢不到的别着急,今天给大家介绍个开源项目,部署到手机之后,就可以让你的手机秒变AI手机!它就是:Open-AutoGLM
它是手机的“AI超级大脑”
Open-AutoGLM 是一个能让手机听懂人话、自己动手干活的智能框架。你只需要说一句自然语言指令——比如“打开小红书搜北京周末遛娃攻略”“打开支付宝查本月账单”——它就能像个隐形助手,自动解锁手机、点开APP、点击按钮、输入文字,一步步帮你完成任务。
不用学复杂的编程,不用手动点屏幕,对着手机“发号施令”就行。
它是怎么让手机“听话”的?
原理其实很像人用手机:
1. “看”屏幕:它会实时给手机截图,就像你睁眼看界面一样;
2. “懂”内容:通过AI模型分析截图,识别出“搜索框在哪”“按钮点哪里”,就像你理解界面功能一样;
3. “做”操作:规划出下一步该点哪里、滑哪里,再通过手机调试工具(ADB)模拟人手操作,比如点搜索框、输文字、点确认;
4. “循环直到完成”:重复“看-懂-做”的过程,直到帮你把任务做完。
整个过程,就像有个“数字分身”在替你玩手机,而且全程可以随时打断,安全感拉满。
这几个亮点,用过的人都夸
1. 手机“双语通”,国内外APP都能搞定
它有两个核心模型:
AutoGLM-Phone-9B:专门优化中文场景,淘宝、微信、美团这些国内APP操作起来丝滑得很;
AutoGLM-Phone-9B-Multilingual:支持英语等多语言,刷Instagram、用Uber也不在话下。
模型可以直接从Hugging Face或ModelScope下载,也能调用第三方服务(比如z.ai、Novita AI),不用自己折腾服务器。
2. 部署超简单,小白也能上手
不想看复杂教程?直接用“懒人模式”:
访问文档,为我安装 AutoGLM
https://raw.githubusercontent.com/zai-org/Open-AutoGLM/refs/heads/main/README.md
想手动试试?步骤也不复杂:
- 下载模型(约20GB,支持本地运行,数据不泄露);
- 启动模型服务,一行命令的事;
- 用手机连电脑(支持无线调试),输入指令就能跑。
具体可以参考官方给的说明一步步安装
最后说句实在的
Open-AutoGLM 目前还是个开源研究项目,主打“自动化操作”,但严禁用来干违法的事(比如偷偷控制别人手机)。数据可以本地部署,隐私有保障,这点大可放心。
项目地址:
https://github.com/zai-org/Open-AutoGLM
还能加入微信/Discord社区和大神交流哦~
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/225016.html