智谱最高涨超18%,正式发布GLM

智谱最高涨超18%,正式发布GLM4 月 8 日 智谱发布开源模型 GLM 5 1 它的亮点在于其能够在一次任务中独立 持续工作超过 8 小时 期间自主规划 执行 自我进化 最终交付完整的工程级成果 资本市场上 智谱 HK2513 今早最高涨幅超 18 截至当天收盘 涨 11 49 从 3 分钟的 Vibe Coding 氛围编程 到 30 分钟的 Agentic Engineering 智能体工程

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



K图 02513_0

  4月8日,智谱发布开源模型GLM-5.1。它的亮点在于其能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。

  资本市场上,智谱(HK2513)今早最高涨幅超18%,截至当天收盘,涨11.49%。

  从3分钟的Vibe Coding(氛围编程)到30分钟的Agentic Engineering(智能体工程),再到本次智谱带来的8小时Long-Horizon Task(长程任务),GLM-5.1再次取得突破。

  代码能力是模型智能水平进一步提升的关键。根据业内最具代表性的三个代码评测基准的平均结果,包括衡量模型专业软件开发工作的SWE-Bench Pro、操作命令行解决问题的Terminal-Bench 2.0、从零构建完整代码仓库的NL2Repo,GLM-5.1取得全球模型第三、国产模型第一、开源模型第一。

  智谱强调,“GLM-5.1是我们迄今最智能的旗舰模型,也是目前全球最强的开源模型。”

  过去两年,行业用Benchmark衡量模型有多智能。智谱认为,下一阶段的衡量标准应该是“能工作多久”,即模型在Long-Horizon Task中的表现,能独立完成多长时间的人类任务。

  在长程任务中保持稳定输出,模型面对的不只是更大代码量,而是一连串复杂的工程决策点:主动跑benchmark、定位瓶颈、修改方案、再跑测试。这对模型提出更高的要求,需要像人类工程师一样,形成“实验→分析→优化”的完整闭环,而不是写完代码停下来等人打分。

  在METR榜单的同等评估标准下,GLM-5.1是唯一达到8小时级持续工作开源模型,也是全球范围内除Claude Opus 4.6外少数具备这一能力的模型。智谱表示,其终极目标是全自治智能体(Autonomous Agent),模型7×24小时不间断地分解目标、执行交付、自我评价与纠正、自我进化,从此无需人类介入。

  让模型跑8小时并不难,真正难的是让第8小时的工作仍然有效。

  智谱认为,延长模型的”有效工作时长”是提升智能体能力的一个基础维度。在这条路上仍然有显著的技术挑战:如何克服模型面对复杂任务上下文焦虑、如何在数千次工具调用后保持执行的一致性、如何更早地跳出局部最优,以及更重要的是如何在没有确定数值指标的任务上建立可靠的自我评估机制。GLM-5.1是其在这个方向上迈出的一步,我们会持续推进。

  智谱财报数据显示,2025年,智谱MaaS(即:开放平台及API业务)商业化全面爆发,MaaS API平台实现ARR 17亿元(约2.5亿美金),同比提升60倍。中国前10大互联网公司中已有9家每天深度调用GLM,每一代模型发布后24小时内即获得字节、阿里、腾讯等头部大厂的官方接入。

  值得注意的是,此次GLM-5.1再次提价10%,此前智谱大模型已进行过两次提价。

  

小讯
上一篇 2026-04-12 22:49
下一篇 2026-04-12 22:47

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/252164.html