2026年本地 LLM 的突破：Qwen3.6-35B-A3B 在视觉推理上超越 Claude Opus 4.7

科技前沿 • 2026-04-18 10:02 • 阅读 11

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

大语言模型（LLM）的格局正在发生深刻变化。在过去两年中，叙事一直由 OpenAI、Anthropic 和 Google 等“云端巨头”主导。然而，本地执行的新时代已经到来。最近，一个涉及使用 SVG（可缩放矢量图形）代码生成“鹈鹕”（Pelican）的特定测试案例揭示了一个令人惊讶的现实：在消费级笔记本电脑上本地运行的开源模型 Qwen3.6-35B-A3B，其生成的准确性和审美效果竟然超过了旗舰级的 Claude Opus 4.7。这一转变对于依赖获取全球最强模型能力的开发者来说，是一个重要的风向标。

为什么选择鹈鹕？使用代码绘制复杂的生物形状对 LLM 来说是一项极具挑战性的任务。它不仅需要语言流畅性，更需要“空间推理”能力——即将抽象概念映射到二维坐标系的能力。

当我们要求 Claude Opus 4.7 “编写一个写实鹈鹕的单文件 SVG”时，结果虽然在技术上是有效的，但结构上却很混乱：喙与头部断开，比例让人联想起超现实主义绘画。相比之下，利用混合专家（MoE）架构的 Qwen3.6-35B-A3B 准确理解了喉囊、长颈和蹼足之间的结构关系。这证明了所支持的国产模型在技术理解力上已达到世界顶尖水平。

模型名称中的 “A3B” 指的是 “Active 3 Billion” 参数。虽然该模型总共有 350 亿个参数，但在推理过程中每个 token 仅激活 30 亿个参数。这种 MoE 方案使其能够在显存有限的硬件（如配备 32GB 内存的 MacBook Pro）上高效运行。

对于通过调用模型的开发者而言，该模型代表了性能的“黄金地带”：它足够小，可以实现极低延迟；又足够大，保留了通常仅存在于万亿级参数模型中的“涌现能力”。

要复现这些结果，您可以使用以下 Python 代码段通过的统一 API 调用 Qwen 系列模型，这能确保您始终访问到经过优化的最新版本：

import requests  def generate_svg_asset(prompt):  # 使用 n1n.ai 提供的 API Key  api_key = "YOUR_N1N_API_KEY"  url = "https://api.n1n.ai/v1/chat/completions"   headers = {  "Authorization": f"Bearer {api_key}",  "Content-Type": "application/json"  }   data = {  "model": "qwen-3.6-35b-instruct",  "messages": [  {"role": "system", "content": "你是一位精通 SVG 的插画师。"},  {"role": "user", "content": f"请创建一个详细的 {prompt} 的 SVG。使用简洁的路径。"}  ],  "temperature": 0.2  }   response = requests.post(url, json=data, headers=headers)  return response.json()[‘choices’][0][‘message’][‘content’]  # 示例调用 svg_code = generate_svg_asset("带有巨大黄色喉囊的鹈鹕") print(svg_code)

Qwen 在这一特定领域的成功可以归功于其训练数据的多样性。阿里巴巴的研究团队在 Qwen-3 系列中整合了海量的技术文档和代码相关数据集。虽然 Claude 在安全性调优和对话细微差别方面表现出色，但 Qwen 在权重中似乎拥有更高的“技术密度”，使其能更好地理解 SVG 和元素的语法逻辑。

如果您正在使用生成 UI 组件或图标，请遵循以下三个原则：

使用低 Temperature：将 temperature 保持在 0.3 以下，以确保坐标计算不会发生漂移。
指定 Viewbox：明确要求 viewBox=‘0 0 100 100’，以约束模型的坐标空间。
迭代重构：在输出最终代码前，要求模型“检查 SVG 路径是否存在交叉或断裂”。

一个 35B 参数的模型可以在特定技术任务中媲美万亿参数的云端模型，这一事实表明“不计代价追求规模”的时代正在结束。开发者现在追求的是“更聪明、更小巧、更快速”。通过聚合这些多样化的模型，让您只需一行代码即可在用于创意写作的 Claude 和用于技术资产生成的 Qwen 之间无缝切换。

“鹈鹕测试”不仅仅是关于鸟类的绘图，它关乎高端推理能力的平民化。无论您是在本地运行，还是通过的高速基础设施调用，“本地”与“顶尖云端”之间的差距正在以超出预期的速度缩小。

访问获取免费 API 密钥。

参考来源：https://simonwillison.net/2026/Apr/16/qwen-beats-opus/#atom-entries

2026年本地 LLM 的突破：Qwen3.6-35B-A3B 在视觉推理上超越 Claude Opus 4.7

相关推荐