2026年智谱GLM-5技术报告首次公开，744B参数、28.5万亿Token训练，国产芯片部署成本降低50%

科技前沿 • 2026-04-23 13:03 • 阅读 0

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

 2月22日，被称为"全球大模型第一股"的智谱正式发布了最新一代基础模型GLM-5的技术报告，首次向外界完整披露了这款模型实现性能跃升的核心技术路径。此举也被视为对此前"套壳""蒸馏海外模型"等质疑的正面回应。
据智谱官微披露的技术报告，GLM-5定位为推动编程范式从"Vibe Coding"（氛围编程）向"Agentic Engineering"（智能体工程）跨越的下一代基础模型，其性能提升主要依托四项关键技术突破。
架构层面，GLM-5引入了DSA稀疏注意力机制，能够根据Token的重要性动态分配注意力资源，在保持长上下文理解能力的同时大幅压缩算力开销。借助这一机制，模型参数规模扩展至744B（7440亿），训练数据量达到28.5T（28.5万亿Token）。
训练基础设施方面，智谱在前代slime框架基础上构建了全新的异步强化学习系统，将生成过程与训练过程深度解耦，支持大规模智能体轨迹探索，显著提升了后训练迭代效率。与之配套的异步Agent强化学习算法，则针对动态环境下的规划与自我纠错能力进行了深度优化——这也是GLM-5在真实编程场景中表现突出的底层支撑。
值得关注的是，GLM-5从发布之初便原生适配国产算力生态，全面兼容华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、天数智芯与燧原七大主流国产芯片平台。据技术报告披露，经过软硬协同优化后，GLM-5在单台国产算力节点上的性能已可媲美双台国际主流GPU集群，长序列处理场景的部署成本降低了50%。
此前，智谱以代号"Pony Alpha"在全球模型服务平台OpenRouter上匿名发布GLM-5。上线数日内，该模型因在复杂代码处理、Agent任务链路等方面的卓越表现引发广泛猜测，部分用户甚至将其误判为Claude Sonnet 5或Grok新版本。智谱在技术报告中表示，这次匿名测试"让社区的认可回归到了'好用与否'这一最纯粹的技术本质"。
硅谷风投机构a16z近期发布的一组对比数据显示，GLM-5与全球顶级闭源模型Claude Opus 4.6之间的能力差距正在快速收窄。
摩根大通近期发布研报称："智谱API定价是前沿领先能力信号，它提供的实时市场出清信号蕴含着模型能力的多维度讯息。此次涨价是模型能力增强的最明确体现。"该行在报告中指出："智谱已经到达了一个重要的拐点，尤其是其全球API业务。GLM-4.5/4.6/4.7的发布，以及明显地向智能体系统、工具增强推理和面向开发人员基础设施的战略性转变，表明公司正将其技术路线图与日益界定全球前沿技术的能力维度相结合。"
不过，GLM-5发布后也遭遇了运营层面的挑战。2月21日，智谱发布致歉信，承认在规则透明度、灰度开放节奏及老用户升级机制上存在不足，并公布了退款和补偿方案。智谱解释称，GLM-5上线后流量远超预期，叠加灰产号池和黄牛党恶意占用资源，导致扩容节奏滞后。
声明：市场有风险，投资需谨慎。本文为AI基于第三方数据生成，仅供参考，不构成个人投资建议。
本文源自：市场资讯
作者：观察君

2026年智谱GLM-5技术报告首次公开，744B参数、28.5万亿Token训练，国产芯片部署成本降低50%

相关推荐