2026年如何评价智谱刚刚发布并开源的GLM-4.5系列大模型？

科技前沿 • 2026-04-05 07:29 • 阅读 1

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

HF：

https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b

不错不错，今年我国的Ai技术大爆发了。更愿我国的Ai技术百花齐放，遥遥领先。

一超多强，我们国家要多超多强！

写一些我个人的关注点：

Air 的规模很接近Llama4-Scout，这个其实是一个之前被Qwen3漏掉的规模。量化的话能在4卡魔改4090/L20的机器上拿到一定的吞吐量，或者在有64GB+的PC上本地运行。

GLM-4.5的规模和Qwen3-480B直接竞争，可以观察一下主打的Agentic Coding性能。

模型训练方面值得关注的点是Muon + 比较常规的GQA（不是GLM4-0414的那种KV cache开销堪比MLA的极少KV head的设计）。

价格很美丽，据说普通版本能达到50tokens每秒，输出速度快确实爽，特别是用惯了ds再用智谱，跟飞起来一样。

还好智谱不怎么没宣发，不然全部人涌进来得卡到爆（bushi）

只能说，智谱体感是真的好强啊，除了没多模态简直是个六边形战士，无解的稳定输出质量高速度快。实测效果在 4.1 以上水准，非常合格。输出稳定质量高速度快，幻觉率极低，这次开源的 k2 没他快，千问没他稳定，两者没他价格便宜，实测体感他最强。

用了很多的大模型下来，还是觉得速度是非常重要的，毕竟都做小功能而已。复杂的目前claude3.7都吃力，更不用说其他模型了。

话说怎么感觉最近越晚出大模型的越强，什么奇怪的设定。

顺带还测试了用glm4.5网页版做的ppt，效果确实不错，能吊打国内其他一些模型，可惜就是不能导出pptx格式。代码方面看了据说还不错，但几次测试下来，不知是不是网页版 max tokens 给得太低了，没有一次代码是写完的，最多九百多吧，也有两三百就截断了的，而gemini是能最多输出2700行代码，再多就截断了，但说这方面好像gemini不错，但glm实验的次数不多，后续还有待考证。