Qwen3.6-35B-A3B 全面评测：阿里开源模型如何超越前沿级水平

科技前沿 • 2026-04-19 08:21 • 阅读 34

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

Qwen3.6-35B-A3B 是阿里 Qwen 团队2026年4月16日发布的最新开源模型，采用稀疏 MoE 架构，35B 总参数但每 token 仅激活 3B
Apache 2.0 许可证，完全开源可商用
在 Terminal-Bench 2.0 得分 51.5（vs Gemma4-31B 的 42.9），SWE-bench Verified 得分 73.4，击败 Claude Sonnet 4.5
支持 262,144 token 上下文，专为代理编程（Agentic Coding）优化
24GB Mac 可通过 GGUF 量化运行

Qwen3.6-35B-A3B 是阿里巴巴 Qwen 团队发布的最新开源模型，2026年4月16日正式上线。该模型专为代理编程（agentic coding）和仓库级代码推理设计。

模型名称解读： - 35B — 总参数数量（MoE 稀疏架构） - A3B — 每 token 仅激活 3B 参数，极大降低推理成本

这是典型的稀疏 MoE（Mixture-of-Experts） 架构——每个 token 只会激活少数「专家」模块的神经元，大部分参数处于休眠状态。结果：用 1/10 的推理算力，达到接近顶级dense模型的能力。

不同于很多「伪开源」模型，Qwen3.6-35B-A3B 采用 Apache 2.0 许可证： - ✅ 商用免费 - ✅ 无版税 - ✅ 可修改和再分发 - ✅ 包含专利授权

Qwen3.6-35B-A3B 在多项基准测试中表现出色：

基准测试 Qwen3.6-35B-A3B Gemma4-31B Claude Sonnet 4.5 Terminal-Bench 2.0 51.5 42.9 — SWE-bench Pro 49.5 35.7 — SWE-bench Verified 73.4 — — RealWorldQA 85.3 — 70.3

Terminal-Bench 2.0（代理式终端编程）得分 51.5，比 Gemma4-31B（42.9）高出 20%。

SWE-bench Pro（真实 GitHub 仓库的软件工程能力）得分 49.5，比 Gemma4-31B（35.7）高出 38%。

RealWorldQA（真实世界多模态理解）得分 85.3，击败 Claude Sonnet 4.5（70.3）21%。

Qwen3.6-35B-A3B 的核心设计目标就是代理编程：

大型仓库导航 — 理解项目结构、依赖、架构
多文件多语言代码编写与修改
命令执行 — 运行测试、构建系统、操作终端
工具调用 — 与 IDE（Continue.dev、Cursor）、API、CICD 系统集成

Qwen3.6 的核心创新是思维模式保留——在多步骤代理工作流中保持完整推理上下文。这意味着： - 决策一致性更强 - 减少重复推理，节省 token - 在思考/非思考模式间优化 KV 缓存利用率

262,144 token 的超长上下文让 Qwen3.6 可以： - 单次输入完整处理中大型代码仓库 - 跨数千行代码保持首尾一致的理解 - 对文件间依赖和架构模式进行推理

brew install ollama ollama run qwen3.6:35b-a3b

通过 4-bit 量化，24GB 内存的 Mac M3 Max 也能流畅运行。完整 F16 模型需要约 72GB，但 4-bit 量化后仅需 ~18-20GB VRAM。

python -m sglang.launch_server --model-path Qwen/Qwen3.6-35B-A3B --port 8000 --tp-size 8 --context-length

平台链接 Hugging Face Qwen/Qwen3.6-35B-A3B Ollama ollama run qwen3.6:35b-a3b Unsloth GGUF unsloth/Qwen3.6-35B-A3B-GGUF Qwen Studio https://qwen.ai

Qwen3.6-35B-A3B 代表着开源 AI 的分水岭时刻——首次，开发者可以在本地运行一个：

3B 激活参数 + 35B 总参数的稀疏 MoE 模型
Gemma4-31B 代理编程能力 +20%
SOTA 级别编程基准测试表现
24GB Mac 可运行的本地部署
Apache 2.0 完全开源可商用

原文链接: Qwen3.6-35B-A3B Complete Review

Qwen3.6-35B-A3B 全面评测：阿里开源模型如何超越前沿级水平

相关推荐