智谱GLM-5.1开源登顶Code Arena榜首，长时任务与工程能力全球领先

科技前沿 • 2026-04-11 12:11 • 阅读 19

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

2026年4月10日，智谱于3月底正式发布GLM-5.1大语言模型。该模型在编程能力专项评测中取得45.3分，仅比当前全球顶尖闭源模型Opus 4.6低2.6分。

近日，GLM-5.1已全面开源，迅速获得开发者社区广泛关注与积极采用。全球权威AI评测平台LMArena最新发布的Code Arena专项榜单显示，GLM-5.1位居开源模型首位，综合排名位列全球第三。该榜单基于百万级用户参与的盲测结果，具有较高公信力。

在技术能力方面，GLM-5.1不仅延续了前代模型在开源领域领先的编码性能，更在长程任务处理能力上实现关键突破，具体表现为：

可在8小时内从零开始完整构建Linux桌面环境；

通过655次迭代成功突破向量数据库性能优化瓶颈；

完成1000轮工具调用，持续优化真实机器学习模型的运行负载。

在METR榜单统一评估框架下，GLM-5.1是目前唯一支持8小时连续稳定运行的开源模型，亦是全球范围内除Opus 4.6外极少数具备同等长时任务执行能力的大模型之一。

此外，在高度贴近实际工程场景的SWE-bench Pro基准测试中，GLM-5.1刷新全球**成绩，超越GPT-5.4与Opus 4.6。该测试要求模型在真实GitHub项目仓库中精准定位并修复复杂工程级缺陷，被公认为检验大模型是否真正具备专业软件开发能力的核心标尺。

 https://ai.zol.com.cn/1162/11621658.html ai.zol.com.cn true 中关村在线 https://ai.zol.com.cn/1162/11621658.html report 994 2026年4月10日，智谱于3月底正式发布GLM-5.1大语言模型。该模型在编程能力专项评测中取得45.3分，仅比当前全球顶尖闭源模型Opus 4.6低2.6分。近日，GLM-5.1已全面开源，迅速获得开发者社区广泛关注与积极采用。全球权威AI评测平台LMArena最新发布的Code Arena专项榜单显...

智谱GLM-5.1开源登顶Code Arena榜首，长时任务与工程能力全球领先

相关推荐