大模型实现“8小时工作制” !智谱GLM

大模型实现“8小时工作制” !智谱GLM科创板日报 4 月 10 日讯 记者 李明明 智谱发布其迄今最智能的模型 近日 智谱发布并开源新一代旗舰模型 GLM 5 1 据介绍 其是唯一达到 8 小时级持续工作的开源模型 在最接近真实软件开发的 SWE bench Pro 基准测试中 GLM 5 1 实现国产模型首次超越 Opus 4 6 OpenRouter 显示 伴随此次发布 智谱 GLM 再度提价 10 科创板日报 记者从相关方获悉

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



《科创板日报》4月10日讯(记者 李明明)智谱发布其迄今最智能的模型。

近日,智谱发布并开源新一代旗舰模型GLM-5.1。据介绍,其是唯一达到8小时级持续工作的开源模型,在最接近真实软件开发的SWE-bench Pro基准测试中,GLM-5.1实现国产模型首次超越Opus 4.6。

OpenRouter显示,伴随此次发布,智谱GLM再度提价10%。

《科创板日报》记者从相关方获悉,与过去一年行业主旋律“降价”截然相反,智谱本次提价,编码场景定价首次追平海外头部厂商Anthropic。这也寓示着国产大模型从价格战、低价换量转向性能溢价。

实测GLM-5.1

关于GLM-5.1的智能水平,智谱团队告诉《科创板日报》记者,GLM-5.1提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。

代码能力是模型智能水平进一步提升的关键。据悉,在业内最具代表性的三个代码评测基准的平均结果中,包括衡量模型专业软件开发工作的SWE-Bench Pro、操作命令行解决问题的Terminal-Bench 2.0、从零构建完整代码仓库的NL2Repo,GLM-5.1取得全球模型第三、国产模型第一、开源模型第一。

这也代表了大模型演进到现在的趋势之一,过去两年,行业用Benchmark衡量模型有多智能。上述智谱团队向《科创板日报》记者判断,下一阶段的衡量标准应该是“能工作多久”,即模型在Long-Horizon Task中的表现,能独立完成多长时间的人类任务。

业内也形成了共识,2025年3月,AI安全研究机构METR提出了一个改变行业认知的指标:任务完成时间线(Task-Completion Time Horizon)——不再衡量模型"多聪明",而是衡量它能独立完成多长时间的人类任务。研究显示,前沿模型的时间线每7个月翻一倍。这条指数曲线被MIT Technology Review称为"AI领域最重要的一张图",Sequoia Capital据此在2026年初宣告"这就是AGI"。

在长程任务中保持稳定输出,模型面对的不只是更大代码量,而是一连串复杂的工程决策点:主动跑benchmark、定位瓶颈、修改方案、再跑测试。这对模型提出更高的要求,需要像人类工程师一样,形成“实验→分析→优化”的完整闭环,而不是写完代码停下来等人打分。

《科创板日报》记者用开发者工具实测了GLM-5.1,测试案例如下:有一个专门考验AI编程能力的测试,任务是让AI做出一个能快速检索海量数据的系统,当时最强的成绩是Claude Opus 4.6创造的。

实测显示,智谱GLM-5.1在持续进行六百多次优化、六千多次操作后,性能还在不断提升,最终速度达到了之前最好成绩的6倍。

据了解,GLM-5.1也刷新了国产开源模型的成绩。

长期以来,全球大模型赛道始终存在一条难以逾越的鸿沟:开源模型与顶尖闭源模型之间存在肉眼可见的能力代差,而中国开源模型更是长期被贴上追赶者的标签,在国际公认的通用能力榜单上,始终与Claude、GPT系列的顶级闭源产品有明显差距。

而在最贴近真实软件开发场景的SWE-bench Pro基准测试中,GLM-5.1实现国产模型对Claude Opus 4.6的首次超越。

智谱GLM再度提价10%

性能提升的同时,智谱在价格层面也与海外厂商看齐,这也是国产模型价格首次对齐海外,模型聚合平台OpenRouter显示,智谱GLM再度提价10%。调价后,GLM-5.1在Coding场景的缓存命中Token价格已接近Anthropic旗下Claude Sonnet 4.6。

这不是智谱第一次涨价,此前,智谱2月12日发布GLM Coding Plan 价格调整函称, GLM Coding Plan市场需求持续强劲增长,用户规模与调用量快速提升。公司决定对GLM Coding Plan套餐价格进行结构性调整,整体涨幅自30%起。

《科创板日报》记者此前独家获悉,海外版GLM-5定价涨幅高于国内:Coding plan订阅价格提高30%-60%,API调用价格提升67%-100%。

此举为国产大模型2026年以来首次大幅提价。

一年前,行业还深陷“价格战”,普遍降价九成以上争夺份额。智谱为何敢于反向操作?

从核心动因看,需求端爆发是直接推手。GLM Coding Plan聚焦开发者代码生成、编程辅助场景,市场需求持续旺盛,用户规模、接口调用量双双快速攀升,平台长期处于高负载运行状态,对算力调度、服务稳定性、响应效率的要求显著提高,需求增速超出原有资源规划与承载能力。

在智谱2025年业绩说明会上,智谱CEO张鹏对《科创板日报》记者介绍,一季度智谱的API调用定价提升83%,即便如此,市场依然呈现出供不应求的情况,调用量增长400%。当前,智谱已成为国内付费Token消耗量最高的厂商之一。

关于涨价,张鹏此前在中关村论坛上回应称,长期依赖低价竞争不利于行业发展,调价旨在将价格拉回正常的商业价值区间。“完成一个长程任务所需要的Token量可能是回答一个简单问题时的十倍甚至百倍,价格调整本质上是价值变化的自然结果。”

据张鹏介绍,智谱已经实现了Token在全球范围内的价值变现。目前,GLM模型已全面部署于Google Vertex AI、AWS Bedrock等全球云服务商,并入驻OpenRouter、Vercel等国际主流模型聚合平台。

智谱MaaS商业化方面,MaaS API平台实现ARR 约17亿元(约2.5亿美金),同比提升60倍。

此外,《科创板日报》记者注意到,2026年开年以来,国内AI行业已从过去的“价格战”转向“价值定价”,一些底层算力与模型服务集体调价,主要包括:

腾讯云:3月11日对自研混元HY2.0系列模型大幅调价, 4月9日再次宣布5月9日起AI算力、容器服务等产品统一上调5%。

阿里云:3月18日宣布4月18日起,AI算力相关产品价格上调5%-34%,智算版存储产品上涨30%。

百度智能云:3月18日发布AI算力、存储等产品调价公告,AI算力相关产品服务上调5%-30%,并行文件存储价格上调约30%。

小讯
上一篇 2026-04-10 19:16
下一篇 2026-04-10 19:14

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/255246.html