智谱在 2025 年7 月 29 日开源了两个全新的旗舰大语言模型: 和 。其核心目标是打破现有模型在特定领域(如推理、编码)表现突出但综合能力不足的局限,将卓越的推理、编码和 (智能体)能力统一到单个模型中。该系列模型采用 (混合专家)架构,并具备创新的混合推理模式,可根据任务复杂性在用于深度思考的 和用于即时响应的 之间切换。在综合性能评测中, 在与业界主流模型的对比中位列第三,展现出强大的竞争力,并在性能与模型规模的权衡中实现了高效率。该模型已通过 Z.ai 平台、API 接口及开源权重等多种方式向用户开放。



- 发布新一代旗舰模型:正式推出 和 两个新模型,旨在统一并提升模型的综合能力。
- 统一三大核心能力:致力于将推理(Reasoning)、编码(Coding)和智能体(Agentic)三大关键能力融合于单一模型,以满足日益复杂的应用需求。
- 创新的混合推理模式:模型内置 (思考模式)和 (非思考模式),前者用于处理复杂任务,后者用于快速响应,实现了性能与效率的平衡。
- 卓越的综合性能:在覆盖 、推理和编码三大领域的 个基准测试中, 综合排名第三,证明了其在行业内的领先地位。
- 先进的技术架构与训练方法:采用 架构,并通过专门设计的强化学习框架 对 能力进行深度优化,最终通过“专家蒸馏”技术整合各项专长。
- 模型规模: 拥有 亿总参数和 亿活跃参数; 则为 亿总参数和 亿活跃参数。
- 综合排名:在与 、、 等多家机构模型的对比中, 综合排名第三, 排名第六。
- 基础能力:模型提供 上下文长度和原生函数调用()能力。
- 基准测试表现:在 和 基准上,其性能与 相当。在网页浏览基准 上,其正确率达到 ,显著优于 ()。
- 工具调用成功率:在 编码任务中,其工具调用平均成功率高达 ,优于 () 等竞争对手。
- 推理能力:在 下,模型能有效解决数学、科学等复杂推理问题,在 、 等基准上表现优异。
- 编码能力:在 等编码基准上表现出色,能够无缝集成 等工具。在与其它模型的对抗测试中,对 的胜率为 ,对 的胜率则高达 。
- 模型架构:采用 架构,通过增加模型深度而非宽度来提升推理能力。同时使用了 、 等技术。
- 训练数据:预训练数据量达 通用语料和 代码与推理语料。
- 强化学习框架:引入并开源了名为 的强化学习(RL)训练框架,该框架通过解耦设计和混合精度推理等技术,高效提升了 任务的训练效率。
- 训练流程:通过有监督微调和专门的强化学习阶段,针对推理和 能力进行优化,最后通过 (专家蒸馏)技术融合各项技能。
- 应用场景:能够创建交互式迷你游戏、物理模拟等复杂代码工件(),并能结合 工具进行幻灯片()和全栈网站开发。
- 接入方式:用户可通过 平台、 或在 和 上获取开源权重进行本地部署。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/222808.html