0day首发!基于昇腾MindSpeed LLM玩转GLM-4.5-Air最新MoE模型

0day首发!基于昇腾MindSpeed LLM玩转GLM-4.5-Air最新MoE模型2025 年 7 月 28 日 智谱开源发布了新 代旗舰模型 GLM 4 5 这是智谱专为智能体应 打造的基础模型 模型权重遵循 MIT License 模型亮点如下 nbsp GLM 4 5 在包含推理 代码 智能体的综合能力达到开源 SOTA 水平 在真实代码智能体的人工对比评测中 实测国内** nbsp 采用混合专家 MoE 架构 包括 GLM 4 5 总参数量

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



2025年7月28日,智谱开源发布了新⼀代旗舰模型GLM-4.5,这是智谱专为智能体应⽤打造的基础模型,模型权重遵循 MIT License。模型亮点如下:

• GLM-4.5 在包含推理、代码、智能体的综合能力达到开源 SOTA 水平,在真实代码智能体的人工对比评测中,实测国内**;

• 采用混合专家(MoE)架构,包括 GLM-4.5:总参数量 3550 亿,激活参数 320 亿;GLM-4.5-Air:总参数 1060 亿,激活参数 120 亿;

• 两种模式:用于复杂推理和工具使用的思考模式,及用于即时响应的非思考模式;

• 高速、低成本:API 调用价格低至输入 0.8 元/百万tokens、输出 2 元/百万tokens;高速版最高可达 100 tokens/秒。

MindSpeed LLM在当日实现了对GLM-4.5-Air模型的无缝支持,并同步开放源代码,目前不仅支持在线推理功能,还提供了基于GLM-4.5-Air的预训练实践参考。作为昇腾大模型套件,MindSpeed LLM作为昇腾AI生态的重要技术支撑,专为大规模语言模型设计,具有超强的计算能力和灵活的开发支持。该系列模型已上线魔乐社区,欢迎下载体验!

🔗模型链接:https://modelers.cn/models/MindSpeed/GLM-4.5-Air

01

模型介绍

衡量AGI的第⼀性原理,是在不损失原有能⼒的前提下融合更多通⽤智能能⼒,GLM-4.5是智谱对此理念的⾸次完整呈现。GLM-4.5 首次在单个模型中实现将推理、编码和智能体能力原生融合,以满足智能体应用的复杂需求。

在最具代表性的12个benchmark⸺MMLU Pro、AIME24、MATH 500、SciCode、GPQA 、HLE、LiveCodeBench、SWE-Bench Verified、Terminal-Bench、TAU-Bench、BFCL v3和 BrowseComp的通⽤能⼒综合评测中,GLM-4.5的总和平均分位列全球模型第三、国产模型第一,开源模型第一。

0day首发!基于昇腾MindSpeed LLM玩转GLM-4.5-Air最新MoE模型_#人工智能

GLM-4.5 和 GLM-4.5-Air 使用了相似的训练流程:首先在 15 万亿 token 的通用数据上进行了预训练,此后在代码、推理、智能体等领域的 8 万亿 token 数据上进行针对性训练,最后通过强化学习进一步增强模型推理、代码与智能体能力。

GLM-4.5 参数量为 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3,但在多项标准基准测试中表现得更为出色,这得益于 GLM 模型的更高参数效率。

GLM-4.5系列原⽣具备在前端编写⽹站、在后端管理数据库,以及通过⼯具调⽤接⼝⽀持任意智能体应⽤等能⼒,能够胜任全栈开发任务,编写较为复杂的应⽤、游戏、交互⽹⻚。

接下来,让我们来体验一下模型的强大效果。

场景1: 一个真的能发弹幕的B站

>>> Prompt: 开发一个包含 UI 的 bilibili 网页端 Demo,页面包括:首页与视频详情页。首页需还原 bilibili 首页的主要设计元素,如顶部导航栏、横幅轮播、推荐视频瀑布流布局、hover 时播放预览、视频封面与标题展示等基础交互。详情页需展示视频标题、UP 主信息、播放区域(支持点击播放/暂停、切换全屏)、预设弹幕(可滚动)、评论区(展示预置评论并支持展开/收起)。视频素材可从 Google/B 站公开视频中挑选,封面图、标题与弹幕内容需根据所选视频内容拟定,保持风格一致。无需支持真实播放,仅需模拟播放行为与基础交互。整体风格参考 bilibili 现有布局,适配 PC 浏览器展示。

场景2: Flappy Bird 小游戏

以下为基于MindSpeed LLM的GLM-4.5-Air手把手部署推理教程。

02

环境安装

• 硬件要求

GLM-4.5-Air的参考硬件配置如下,本文将以A2单机8卡推理,A3八机64卡预训练为例进行介绍:

• MindSpeed LLM仓库部署

MindSpeed LLM的主要依赖配套如下表,安装步骤参考安装指导(🔗https://gitee.com/ascend/MindSpeed-LLM/blob/master/docs/pytorch/install_guide.md)

(1)仓库拉取

(2)环境搭建

torch npu 与 CANN包参考链接:安装包参考原文链接(🔗https://support.huawei.com/enterprise/zh/ascend-computing/cann-pid-/software)

意:

由于首发最新版本支持,要求transformers版本为4.54.0,用户需执行以下命令:

• 权重转换

(1)权重下载

从魔乐社区链接下载权重和配置文件。

https://modelers.cn/models/zhipuai/GLM-4.5-Air

(2)权重转换

MindSpeed LLM提供脚本将开源权重转换为mcore权重,用于训练、推理、评估等任务。

使用方法如下,请根据实际需要的TP/PP等切分策略和权重路径修改权重转换脚本

• 数据预处理

MindSpeed LLM提供脚本进行数据集处理

使用方法如下,请根据实际需要修改以下参数

• 推理

用户需要根据实际情况修改脚本中以下变量

• 训练

用户需要根据实际情况修改脚本中以下变量

欢迎体验

欢迎大家下载体验GLM-4.5,也欢迎广大开发者在模型评论区留言交流!

小讯
上一篇 2026-03-30 18:13
下一篇 2026-03-30 18:11

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/230059.html