

阿里在Qwen3.6-Plus发布之后,今日推出了Qwen3.6-Max-Preview。该预览版带来了更强的世界知识和指令遵循能力,在多项基准上显著提升了智能体编程表现。
在SWE - bench Pro、Terminal - Bench 2.0等六项主要编程基准上,Qwen3.6-Max-Preview取得了最高分,相比前代有大幅进步。同时,在知识(SuperGPQA、QwenChineseBench)和指令遵循(ToolcallFormatIFBench)方面也表现更优。

Qwen3.6-Max-Preview的主要特性包括相比Qwen3.6-Plus显著提升的智能体编程能力、更强的世界知识和指令遵循,以及更优的真实场景智能体与知识可靠性表现。
评测对比显示,相比Qwen3.6-Plus,预览版在智能体编程方面取得显著提升,如SkillsBench +9.9、SciCode +10.8等;世界知识更强,如SuperGPQA +2.3、QwenChineseBench +5.3;指令遵循也更优,如ToolcallFormatIFBench +2.8。

作为预览版,Qwen3.6-Max-Preview模型仍在积极迭代中,后续版本将持续优化。这意味着用户可以期待该模型在未来有更出色的表现。
编辑观点:Qwen3.6-Max-Preview的发布展现了阿里在大模型领域的持续创新。其在编程和知识能力上的提升,有望在相关领域带来新的应用和突破,未来发展值得关注。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/272528.html