2026年股价已涨200% 海外神秘大模型几乎确定为GLM-5:复用DS架构

股价已涨200% 海外神秘大模型几乎确定为GLM-5:复用DS架构2 月 10 日消息 前几天我们提到春节期间国产 AI 行业会有几款重磅产品推出 除了最受关注的 DeepSeek V4 之外 智谱的新一代大模型 GLM 5 也要上线了 推动该公司股价近期大涨 200 前几天在全球模型服务平台 OpenRouter 上线了一款代号为 Pony Alpha 的匿名模型 引起了全球关注 因为它的表现很不错 尤其是在写代码方面被认为能达到 Claude Opus 一个级别 Pony

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



2月10日消息,前几天我们提到春节期间国产AI行业会有几款重磅产品推出,除了最受关注的DeepSeek V4之外,智谱的新一代大模型GLM-5也要上线了,推动该公司股价近期大涨200%。

前几天在全球模型服务平台OpenRouter上线了一款代号为“Pony Alpha”的匿名模型,引起了全球关注,因为它的表现很不错,尤其是在写代码方面被认为能达到Claude Opus一个级别。

Pony Alpha到底是哪家的模型一度引发网友热烈讨论,目前几乎可以确定是智谱的GLM-5了,一方面是系统的提示词显示它说自己是GLM,另一方面网友验证了一个GLM大模型家族的特**ug,那就是输入 “锅内倒入植物油烧热” 得到的答案是乱七八糟的,Pony Alpha也符合这个特点。

随着更多信息的挖掘出来,GLM-5的技术架构也差不多明确了,它采用了与DeepSeek-V3/V3.2相同的技术路线——DeepSeek稀疏注意力,简称DSA,总参数量达745B,是上一代GLM-4.7的2倍。

除了DSA之外,GLM-5另一大技术特色是多Token预测(Multi-Token Prediction,MTP),有78层隐藏层,256个专家,每次激活8个,激活参数约44B,稀疏度5.9%,上下文窗口最高支持202K token。

复用DS架构的好处有很多,可以直接受益于vLLM、SGLang等主流推理框架的现有优化,部署门槛将大幅降低。

不过值得关注的是GLM-5的多模态能力,因为DS此前还是文本大模型,不支持视频的,而多模态能力在2026年是新一代大模型不应该缺少的能力。

随着GLM大模型在海内外受到欢迎,智谱公司股价近期也一路上涨,总市值已经到了1500亿港币左右,是数月前IPO上市时的3倍。(宪瑞)

 原文链接: 股价已涨200% 海外神秘大模型几乎确定为GLM-5:复用DS架构 </div> 
小讯
上一篇 2026-03-13 19:25
下一篇 2026-03-13 19:27

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/216996.html