4月8日,智谱发布了新一代旗舰模型GLM-5.1,并宣布该模型在华为云上同步上线。据称,GLM-5.1是目前全球最强的开源模型,其独特之处在于能够在昇腾算力上实现Layer级MOE绝对均衡。
通过优化框架能力,GLM-5.1能够使专家均衡产出Token,同时结合昇腾Attention算子特征,进行推理框架与硬件协同的定向优化,从而提升算力均衡及HBM访存均衡能力。华为云通过系统级优化,实现了推理加速,整体吞吐量提升了30%。
华为云MaaS平台已为开发者提供了免部署、一键调用GLM-5.1 API的服务,支持在线体验。企业用户则可通过华为云魔坊(ModelArts)模型训推平台,快速完成推理服务的部署上线,支持公共池和专属池两种资源部署方式,以满足不同场景下的算力需求。
根据官方介绍,GLM-5.1是唯一一个达到8小时持续工作的开源模型,在SWE-benchPro基准测试中,首次超越了Opus4.6,标志着国产模型在这一领域的突破。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/254309.html