智谱AI深夜上线全新Agent GLM-PC,再见仍是巅峰。

智谱AI深夜上线全新Agent GLM-PC,再见仍是巅峰。年前 AI 圈混战 热闹程度不亚于 23 年 3 月 一个个都卷麻了 OpenAI 半泄漏半预热搞了半天的 Agent 产品 Operator 还没来 智谱的新版 Agent GLM PC 悄无声息的憋了个大的 直接先来了 昨天夜里 智谱突然让我帮忙试一下他们的 Agent 真的是夜里 AI 圈好热闹 但是作为一个自媒体 我的肝好想说 求求了 大过年的 放过我吧 没办法 为了首发 咋办呢

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



年前AI圈混战,热闹程度不亚于23年3月,一个个都卷麻了。

OpenAI半泄漏半预热搞了半天的Agent产品Operator还没来。

智谱的新版Agent GLM-PC悄无声息的憋了个大的,直接先来了。

昨天夜里,智谱突然让我帮忙试一下他们的Agent。

真的是夜里。。。

AI圈好热闹,但是作为一个自媒体,我的肝好想说:

求求了,大过年的,放过我吧。。。

没办法,为了首发,咋办呢,只能熬夜一个通宵,肝他娘的。

还好,在体验了一夜后,GLM-PC 1.1版本,没有让我失望。

虽然小问题还是有一些,但,前路已明。

可以说,如今AI领域,最让我兴奋、最让我觉得科幻的,也只有Agent了。

也给大家简单过一下他们Agent的历史。

2024年10月25日,智谱在CNCC发布了第一款手机自主人工智能,AutoGLM,直接在行业内和金融市场上掀起了风暴。

2024年11月29日,智谱在Agent OpenDay上,宣布升级版的AutoGLM,还有电脑版本的自主人工智能,GLM-PC 1.0内测版。

但是那时候,GLM-PC还是非常不成熟的,我也在当时的发布会现场写到:

终于,两个月以后,GLM-PC 1.1正式版,来了。

复杂任务拆解能力大幅强化,任务成功率比1.0高太多太多了,操作速度直逼人类,每步操作几乎都在1.5s以内,虽然别看只是0.1版本的升级,但我觉得他们内部对比版本号命名还是保守了,其实完全可以叫2.0的,再不济1.5也是可以的。。。

而且,Mac和Windows,全都都可用了。

跨越时空,智谱AI也完成了7年前,老罗在鸟巢那个“理解万岁”的梦。

也不知道,老罗看着如今的GLM-PC 1.1版本,会不会也摇着扇子,感慨到:我当年那个TNT也是很酷的啊,就是这么想的啊…如果我们晚做7年…可惜啊,没有如果。

网址在此:https://cogagent.aminer.cn/home

下载注册以后,就会来到首页。

虽然我也不知道智谱他们为啥要给GLM-PC取名叫牛牛,可能,是因为GLM-PC作为新时代的Agent代表,可以堪称赛博牛马?…

这次最大的功能更新,是他们加入的深度思考。

类似于OpenAI o1那种做法,你给GLM-PC发一个任务,他会给你先生成一套非常详细的思维链,自己给自己想明白以后,再去执行。

比如说给微信上的“熬夜测试”群的所有群成员发送2025年新春祝福语。

他会一步一步思考、拆解、返回结果,即使失败了也会自己PUA自己来进行重新反思。

而且最特别的是,跟手机端的AutoGLM不一样,这次更新明显不只是纯视觉方案了,还引入了代码机制。

生成的内容,是函数,在上图中,能看到两个GLM-PC定义的函数LAUNCH_APP和CogAgent。

这个点非常有意思,代码是极度严谨、规范、正确率高的方式,他们抛弃了传统的思维链,而是使用代码式的思维链,在我几个小时的体验里,明显能感觉到,在这套逻辑的加持下,GLM-PC对复杂任务的规划、推理、和反思的能力,得到了明显的强化。

之前GLM-PC 1.0版本的模型,是智谱在2023年就开始做的多模态GUI Agent - CogAgent,去年12月20他们也直接开源出去了,能感知和理解交互界面中的视觉元素与布局,模拟人类做出任意元操作,就比如点击、键盘输入、悬浮、拖拽那些。

而这次加入代码后,通过代码思维框架和图形界面的结合,有点像神经心理学理论中的左右脑,为右脑补齐了理性的左脑,成了一个真正完整的智能。

看看上面这个case的实际运行效果。视频为了大家观感,我都做了2倍速处理。

整体上,一气呵成,直接给我测试群里四个人,全部发了一个新春祝贺,甚至还是定制化的,每个人都写了名字,内容还不一样。

我还能说什么好呢?

真的,玩AI这么久,体验了几百款AI产品,我已经很久没有被AI所震撼了。

但是当这种任务,在电脑上,AI理解我的意图后,自动化完美的处理完成的时候,我才真真切切的感受到。

科幻变成现实的感觉。

全世界,智谱,是第一个做到的。

这一刻,怎么吹国产AI,我觉得都不为过。

2025,必是真正的Agent之年。

我也希望,是属于智谱Agent,璀璨的一年。

除了单纯的发微信文字消息,你还可以让AI,给你制作图片和视频,自动发送过去。

比如,我想让GLM-PC,给微信上的“鲜虾包”发送2025年新春祝福语,再给他制作一个新春图片和一个新春祝贺视频,发送给他。

不止发文字,GLM-PC还直接调用智谱自己的接口,创作了图和视频,发给了鲜虾包。

太太太太牛逼了。

这个图片和视频的美感虽然确实有点不太好看,但是不妨碍作为Agent的这个能力,直接酷到爆炸好吧。

又比如我还可以让它:

直接一气呵成。

虽然最后出现了BUG,一直卡死在时间循环那了,因为调用错了时间,且飞书日历只有半点和整点,时间匹配不上,所以没能成功。

但是在我看来,依然瑕不掩瑜。

整体测试上,在多步任务上表现还算是比较稳定的。

比如马上春节了,我们可以让它:打开小红书,在小红书搜索春节习俗,获取前三篇的图片和文字介绍,扩写成一篇文章,保存到桌面Word文件。

可以看到,这些任务都执行的很好,把前三篇的文章都保存下来了,还能扩写,word文件也保存的很好。

你什么都不需要干,只需要一句话,一篇word就完事了。

这一瞬间,我感觉,我看见了未来。

我脑子里莫名其妙想到的一个场景。

我穿越回到了1976年,在加州那个著名的车库里,我面前站着乔布斯和沃兹尼亚克,看着他们正在焊那个具有革命意义的Apple I,我拉着他们走到旁边,说:

嘿,给你们看一个神迹。

这叫,人工智能。

你看,我也见证了一个新的时代,见证了人机交互的又一次变革。

GLM-PC 1.1的出现,固然还有很多不足之处,比如任务成功率不是百分百,有时候也会陷入死循环。还会对着屏幕乱点,屏幕尺寸的支持也不是很好,我的带鱼屏直接没法用,只能拔了外接屏幕用我的笔记本标准分辨率的屏幕。

甚至,在我们的幻想里,真正的Agent,应该是可以打开剪映给我们自动剪个片子,打开Blendr自动建个模,它应该是个无所不能的超人。

当然,今天,AI还没有达到这一步。

但是永远不要怀疑,AI的潜力。

凌晨5点,我合上电脑,关灯入眠。

隐约中,我仿佛看到了一束光。

想来,当它再次亮起的时候。

我或许会跟着它一起,走得更远,更深。

走向那个,与现在相连的未来。

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧

小讯
上一篇 2026-04-06 22:03
下一篇 2026-04-06 22:01

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/219891.html