2026年4月19日,阿里云千问团队正式面向全球开发者开源中等尺寸混合专家大模型Qwen3.6-35B-A3B。该模型总参数量达350亿,依托混合专家MoE架构设计,实际推理阶段仅激活30亿参数,可显著降低开发者的算力使用成本。在多项权威AI基准测试中,其性能超越前代产品,可媲美更大参数量的稠密模型,同时新增多模态思考能力。
此次开源的Qwen3.6-35B-A3B是通义千问3.6系列推出的首款中等尺寸混合专家模型,核心设计目标就是解决当前大模型行业落地的核心矛盾:高性能模型推理成本过高,中小开发团队无力承担部署与微调开销。
MoE混合专家架构的核心逻辑,是将总模型拆分为多个独立的专家子网络,每次推理仅调用少数子网络参与计算。得益于此,这款总参数量350亿的模型,实际运行时的计算量仅相当于30亿参数的稠密模型,算力成本相比同总参的稠密模型降低超过八成,普通开发者用消费级显卡就可完成本地化部署与微调。
千问团队公布的测试数据显示,Qwen3.6-35B-A3B的性能表现超出市场预期。在考察终端编程能力的Terminal-Bench2.0、针对真实场景智能体能力的评估中,该模型得分不仅较前代同尺寸产品提升近9个百分点,甚至能够与参数规模更大的稠密模型一较高下,实现了“以小博大”的跨级对标。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/272268.html