智谱GLM-5.1上线华为云，AI推理性能提升30%

科技前沿 • 2026-04-09 16:47 • 阅读 1
大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。
 近日，华为云与智谱联合宣布，新一代开源大模型GLM-5.1正式上线华为云平台，成为全球首个具备8小时级持续工作能力的开源模型。这一发布不仅在技术层面上实现了显著突破，也为开发者和企业用户提供了更高效的AI解决方案。
GLM-5.1在SWE-benchPro基准测试中表现突出，首次超越国际主流模型Opus4.6，标志着国产大模型在复杂软件开发场景中取得了关键进展。该模型通过深度优化昇腾算力架构，展现出在推理性能和算力分配效率上的显著提升。具体而言，GLM-5.1在模型层采用了Layer级MOE均衡设计，结合华为昇腾Attention算子的特性，构建了推理框架与硬件的协同优化机制。这一创新架构使得算力分配效率提升了40%，HBM访存均衡度提高了35%，整体推理吞吐量较前代提升了30%。
华为云为开发者提供了双重服务模式，极大地降低了企业应用大模型的技术门槛。通过MaaS平台，开发者可以即开即用GLM-5.1的API服务，支持实时在线体验。而企业用户则可以借助ModelArts平台，快速完成模型部署，提供公共算力池与专属算力池两种资源方案，灵活满足不同场景的算力需求。这种分层服务策略不仅提升了开发效率，也使得企业能够更加便捷地在其业务中应用大模型技术。
作为开源生态的重要里程碑，GLM-5.1的代码与训练框架已完全开放。与传统模型相比，其持续工作能力突破了2-3小时的续航限制，能够在连续8小时高强度任务中保持性能稳定。在真实软件开发场景的测试中，该模型展现出了更强的代码生成准确性和复杂逻辑处理能力，尤其在多文件协同修改、第三方库调用等场景中的表现尤为优异。
此次华为云与智谱的合作，构建了从底层算力到上层应用的完整技术栈。通过硬件架构与模型算法的深度适配，双方验证了国产AI基础设施在处理超大规模参数模型时的技术可行性。这为金融、制造、科研等领域的大模型应用提供了新的技术范式，推动了国产AI技术的进一步发展。
总结而言，智谱GLM-5.1的发布不仅为开发者和企业用户带来了强大的技术支持，也为国内AI产业的发展注入了新的活力。随着大模型技术的不断进步，未来的应用场景将更加广泛，技术壁垒将进一步降低，国产AI的崛起值得期待。
智谱GLM-5.1上线华为云，AI推理性能提升30%

相关推荐