Qwen3.6-35B-A3B 全面评测:阿里开源模型如何超越前沿级水平

Qwen3.6-35B-A3B 全面评测:阿里开源模型如何超越前沿级水平Qwen3 6 35B A3B 是阿里 Qwen 团队 2026 年 4 月 16 日发布的最新开源模型 采用稀疏 MoE 架构 35B 总参数但每 token 仅激活 3B Apache 2 0 许可证 完全开源可商用 在 Terminal Bench 2 0 得分 51 5 vs Gemma4 31B 的 42 9 SWE bench Verified 得分 73 4 击败 Claude

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



  • Qwen3.6-35B-A3B 是阿里 Qwen 团队2026年4月16日发布的最新开源模型,采用稀疏 MoE 架构,35B 总参数但每 token 仅激活 3B
  • Apache 2.0 许可证,完全开源可商用
  • 在 Terminal-Bench 2.0 得分 51.5(vs Gemma4-31B 的 42.9),SWE-bench Verified 得分 73.4,击败 Claude Sonnet 4.5
  • 支持 262,144 token 上下文,专为代理编程(Agentic Coding)优化
  • 24GB Mac 可通过 GGUF 量化运行

Qwen3.6-35B-A3B 是阿里巴巴 Qwen 团队发布的最新开源模型,2026年4月16日正式上线。该模型专为代理编程(agentic coding)和仓库级代码推理设计。

模型名称解读: - 35B — 总参数数量(MoE 稀疏架构) - A3B — 每 token 仅激活 3B 参数,极大降低推理成本

这是典型的稀疏 MoE(Mixture-of-Experts) 架构——每个 token 只会激活少数「专家」模块的神经元,大部分参数处于休眠状态。结果:用 1/10 的推理算力,达到接近顶级dense模型的能力。

不同于很多「伪开源」模型,Qwen3.6-35B-A3B 采用 Apache 2.0 许可证: - ✅ 商用免费 - ✅ 无版税 - ✅ 可修改和再分发 - ✅ 包含专利授权


Qwen3.6-35B-A3B 在多项基准测试中表现出色:

基准测试 Qwen3.6-35B-A3B Gemma4-31B Claude Sonnet 4.5 Terminal-Bench 2.0 51.5 42.9 — SWE-bench Pro 49.5 35.7 — SWE-bench Verified 73.4 — — RealWorldQA 85.3 — 70.3

Terminal-Bench 2.0(代理式终端编程)得分 51.5,比 Gemma4-31B(42.9)高出 20%

SWE-bench Pro(真实 GitHub 仓库的软件工程能力)得分 49.5,比 Gemma4-31B(35.7)高出 38%

RealWorldQA(真实世界多模态理解)得分 85.3,击败 Claude Sonnet 4.5(70.3)21%


Qwen3.6-35B-A3B 的核心设计目标就是代理编程

  1. 大型仓库导航 — 理解项目结构、依赖、架构
  2. 多文件多语言代码编写与修改
  3. 命令执行 — 运行测试、构建系统、操作终端
  4. 工具调用 — 与 IDE(Continue.dev、Cursor)、API、CICD 系统集成

Qwen3.6 的核心创新是思维模式保留——在多步骤代理工作流中保持完整推理上下文。这意味着: - 决策一致性更强 - 减少重复推理,节省 token - 在思考/非思考模式间优化 KV 缓存利用率

262,144 token 的超长上下文让 Qwen3.6 可以: - 单次输入完整处理中大型代码仓库 - 跨数千行代码保持首尾一致的理解 - 对文件间依赖和架构模式进行推理


brew install ollama ollama run qwen3.6:35b-a3b 

通过 4-bit 量化,24GB 内存的 Mac M3 Max 也能流畅运行。完整 F16 模型需要约 72GB,但 4-bit 量化后仅需 ~18-20GB VRAM。

python -m sglang.launch_server --model-path Qwen/Qwen3.6-35B-A3B --port 8000 --tp-size 8 --context-length  

平台 链接 Hugging Face Qwen/Qwen3.6-35B-A3B Ollama ollama run qwen3.6:35b-a3b Unsloth GGUF unsloth/Qwen3.6-35B-A3B-GGUF Qwen Studio https://qwen.ai

Qwen3.6-35B-A3B 代表着开源 AI 的分水岭时刻——首次,开发者可以在本地运行一个:

  • 3B 激活参数 + 35B 总参数的稀疏 MoE 模型
  • Gemma4-31B 代理编程能力 +20%
  • SOTA 级别编程基准测试表现
  • 24GB Mac 可运行的本地部署
  • Apache 2.0 完全开源可商用

原文链接: Qwen3.6-35B-A3B Complete Review

小讯
上一篇 2026-04-19 08:22
下一篇 2026-04-19 08:20

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/269031.html