智谱GLM-5.1开源登顶Code Arena榜首,长时任务与工程能力全球领先

智谱GLM-5.1开源登顶Code Arena榜首,长时任务与工程能力全球领先2026 年 4 月 10 日 智谱于 3 月底正式发布 GLM 5 1 大语言模型 该模型在编程能力专项评测中取得 45 3 分 仅比当前全球顶尖闭源模型 Opus 4 6 低 2 6 分 近日 GLM 5 1 已全面开源 迅速获得开发者社区广泛关注与积极采用 全球权威 AI 评测平台 LMArena 最新发布的 Code Arena 专项榜单显示 GLM 5 1 位居开源模型首位 综合排名位列全球第三

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



2026年4月10日,智谱于3月底正式发布GLM-5.1大语言模型。该模型在编程能力专项评测中取得45.3分,仅比当前全球顶尖闭源模型Opus 4.6低2.6分。

近日,GLM-5.1已全面开源,迅速获得开发者社区广泛关注与积极采用。全球权威AI评测平台LMArena最新发布的Code Arena专项榜单显示,GLM-5.1位居开源模型首位,综合排名位列全球第三。该榜单基于百万级用户参与的盲测结果,具有较高公信力。

在技术能力方面,GLM-5.1不仅延续了前代模型在开源领域领先的编码性能,更在长程任务处理能力上实现关键突破,具体表现为:

可在8小时内从零开始完整构建Linux桌面环境;

通过655次迭代成功突破向量数据库性能优化瓶颈;

完成1000轮工具调用,持续优化真实机器学习模型的运行负载。

在METR榜单统一评估框架下,GLM-5.1是目前唯一支持8小时连续稳定运行的开源模型,亦是全球范围内除Opus 4.6外极少数具备同等长时任务执行能力的大模型之一。

此外,在高度贴近实际工程场景的SWE-bench Pro基准测试中,GLM-5.1刷新全球**成绩,超越GPT-5.4与Opus 4.6。该测试要求模型在真实GitHub项目仓库中精准定位并修复复杂工程级缺陷,被公认为检验大模型是否真正具备专业软件开发能力的核心标尺。

  ai.zol.com.cn true  https://ai.zol.com.cn/1162/11621658.html report 994 2026年4月10日,智谱于3月底正式发布GLM-5.1大语言模型。该模型在编程能力专项评测中取得45.3分,仅比当前全球顶尖闭源模型Opus 4.6低2.6分。近日,GLM-5.1已全面开源,迅速获得开发者社区广泛关注与积极采用。全球权威AI评测平台LMArena最新发布的Code Arena专项榜单显... 
小讯
上一篇 2026-04-11 12:12
下一篇 2026-04-11 12:10

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/256884.html