智谱GLM-5.1开源:754B参数MoE模型可连续工作8小时

智谱GLM-5.1开源:754B参数MoE模型可连续工作8小时p strong 核心建议 strong GLM 5 1 在 SWE bench Pro 基准以 58 4 分超越 GPT 5 4 和 Claude Opus 4 6 三大代码评测综合平均分位列全球第三 开源模型第一 该模型支持 8 小时长程自主任务 在向量数据库优化场景中实现 6 倍吞吐量提升 采用 MIT 协议完全开源 支持商业使用 p

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



 

核心建议:GLM-5.1在SWE-bench Pro基准以58.4分超越GPT-5.4和Claude Opus 4.6,三大代码评测综合平均分位列全球第三、开源模型第一。该模型支持8小时长程自主任务,在向量数据库优化场景中实现6倍吞吐量提升。采用MIT协议完全开源,支持商业使用,适合需要长周期自动化工程任务的开发团队评估,但需注意754B参数规模对硬件的高要求。

GLM-5

GLM-5.1采用754B参数Mixture-of-Experts(MoE)架构,单次推理激活40B参数,配备200K Token上下文窗口与131K Token最大输出长度 。其核心技术突破在于DeepSeek Sparse Attention(DSA)稀疏注意力机制,通过仅关注关键信息片段降低长文本处理算力消耗,同时保持上下文理解能力 。

值得注意的是,该模型完全基于华为昇腾910B芯片训练,未使用英伟达硬件,验证了中国本土算力基础设施训练前沿模型的可行性 。

在代表真实软件开发能力的权威评测中,GLM-5.1表现如下:

SWE-bench Pro 58.4 57.7 57.3 54.2 该基准第一 Terminal-Bench 2.0 待验证 待验证 领先 待验证 命令行任务 NL2Repo 待验证 待验证 领先 待验证 代码库生成 CyberGym 68.7 待验证 66.6 待验证 网络安全 KernelBench Level 3 3.6倍加速 待验证 4.2倍加速 待验证 GPU内核优化

综合定位:在SWE-bench Pro、Terminal-Bench 2.0、NL2Repo三大代码基准的综合平均分中,GLM-5.1取得全球第三、国产模型第一、开源模型第一的成绩 。在SWE-bench Pro单项上,以58.4分成为该基准目前公开记录中的高分模型 。

GLM-5.1的核心差异化能力在于长周期自主任务执行(Long-Horizon Task),区别于传统分钟级交互模型:

对于希望私有化部署的开发者,建议按以下流程操作:

  1. 硬件评估:确认具备企业级GPU集群资源。754B参数规模(激活40B)对显存与算力要求较高,消费级硬件难以承载完整模型推理 。
  2. 获取模型权重:访问Hugging Face仓库(zai-org/GLM-5.1)或ModelScope(ZhipuAI/GLM-5.1)下载标准版或FP8量化版权重文件 。
  3. 环境配置:使用vLLM或SGLang推理框架进行部署。华为云用户可通过ModelArts平台一键完成推理服务部署,支持公共池与专属池两种资源模式 。
  4. 工具链集成:在Claude Code、OpenCode、Kilo Code等主流开发工具中,通过修改配置文件将默认模型指向GLM-5.1 API端点,实现开发环境无缝切换 。
  5. API调用:通过BigModel开放平台(bigmodel.cn)或Z.ai(z.ai)获取API密钥,输入成本约$1.40/百万Token,输出成本$4.40/百万Token,缓存命中Token成本$0.26/百万Token 。

GLM-5.1采用MIT许可证完全开源,这是中国头部大模型厂商首次以如此宽松的条件开源旗舰级模型 。MIT协议允许用户自由使用、修改、分发及商业部署,无需支付授权费用或公开衍生作品源码。

需注意的是,智谱同步上调了API服务价格10%,调价后Coding场景缓存命中Token价格已接近Anthropic Claude Sonnet 4.6水平,标志着国产大模型首次在核心场景实现与海外头部厂商的价格对齐 。

建议使用场景

当前局限


总结:GLM-5.1的开源标志着国内大模型在工程化能力上的重要突破,其8小时长程任务能力与MIT开源协议为开发者提供了新的技术选项。建议有长周期自动化需求的工程团队优先评估,但需充分评估硬件投入成本与模型在特定业务场景中的实际表现。

小讯
上一篇 2026-04-11 07:41
下一篇 2026-04-11 07:39

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/254721.html