2026年本地 LLM 的突破:Qwen3.6-35B-A3B 在视觉推理上超越 Claude Opus 4.7

本地 LLM 的突破:Qwen3.6-35B-A3B 在视觉推理上超越 Claude Opus 4.7大语言模型 LLM 的格局正在发生深刻变化 在过去两年中 叙事一直由 OpenAI Anthropic 和 Google 等 云端巨头 主导 然而 本地执行的新时代已经到来 最近 一个涉及使用 SVG 可缩放矢量图形 代码生成 鹈鹕 Pelican 的特定测试案例揭示了一个令人惊讶的现实 在消费级笔记本电脑上本地运行的开源模型 Qwen3 6 35B A3B

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



大语言模型(LLM)的格局正在发生深刻变化。在过去两年中,叙事一直由 OpenAI、Anthropic 和 Google 等“云端巨头”主导。然而,本地执行的新时代已经到来。最近,一个涉及使用 SVG(可缩放矢量图形)代码生成“鹈鹕”(Pelican)的特定测试案例揭示了一个令人惊讶的现实:在消费级笔记本电脑上本地运行的开源模型 Qwen3.6-35B-A3B,其生成的准确性和审美效果竟然超过了旗舰级的 Claude Opus 4.7。这一转变对于依赖 获取全球最强模型能力的开发者来说,是一个重要的风向标。

为什么选择鹈鹕?使用代码绘制复杂的生物形状对 LLM 来说是一项极具挑战性的任务。它不仅需要语言流畅性,更需要“空间推理”能力——即将抽象概念映射到二维坐标系的能力。

当我们要求 Claude Opus 4.7 “编写一个写实鹈鹕的单文件 SVG”时,结果虽然在技术上是有效的,但结构上却很混乱:喙与头部断开,比例让人联想起超现实主义绘画。相比之下,利用混合专家(MoE)架构的 Qwen3.6-35B-A3B 准确理解了喉囊、长颈和蹼足之间的结构关系。这证明了 所支持的国产模型在技术理解力上已达到世界顶尖水平。

模型名称中的 “A3B” 指的是 “Active 3 Billion” 参数。虽然该模型总共有 350 亿个参数,但在推理过程中每个 token 仅激活 30 亿个参数。这种 MoE 方案使其能够在显存有限的硬件(如配备 32GB 内存的 MacBook Pro)上高效运行。

对于通过 调用模型的开发者而言,该模型代表了性能的“黄金地带”:它足够小,可以实现极低延迟;又足够大,保留了通常仅存在于万亿级参数模型中的“涌现能力”。

要复现这些结果,您可以使用以下 Python 代码段通过 的统一 API 调用 Qwen 系列模型,这能确保您始终访问到经过优化的最新版本:

import requests  def generate_svg_asset(prompt):  # 使用 n1n.ai 提供的 API Key  api_key = "YOUR_N1N_API_KEY"  url = "https://api.n1n.ai/v1/chat/completions"   headers = {  "Authorization": f"Bearer {api_key}",  "Content-Type": "application/json"  }   data = {  "model": "qwen-3.6-35b-instruct",  "messages": [  {"role": "system", "content": "你是一位精通 SVG 的插画师。"},  {"role": "user", "content": f"请创建一个详细的 {prompt} 的 SVG。使用简洁的路径。"}  ],  "temperature": 0.2  }   response = requests.post(url, json=data, headers=headers)  return response.json()[‘choices’][0][‘message’][‘content’]  # 示例调用 svg_code = generate_svg_asset("带有巨大黄色喉囊的鹈鹕") print(svg_code) 

Qwen 在这一特定领域的成功可以归功于其训练数据的多样性。阿里巴巴的研究团队在 Qwen-3 系列中整合了海量的技术文档和代码相关数据集。虽然 Claude 在安全性调优和对话细微差别方面表现出色,但 Qwen 在权重中似乎拥有更高的“技术密度”,使其能更好地理解 SVG 元素的语法逻辑。

如果您正在使用 生成 UI 组件或图标,请遵循以下三个原则:

  1. 使用低 Temperature:将 temperature 保持在 0.3 以下,以确保坐标计算不会发生漂移。
  2. 指定 Viewbox:明确要求 viewBox=‘0 0 100 100’,以约束模型的坐标空间。
  3. 迭代重构:在输出最终代码前,要求模型“检查 SVG 路径是否存在交叉或断裂”。

一个 35B 参数的模型可以在特定技术任务中媲美万亿参数的云端模型,这一事实表明“不计代价追求规模”的时代正在结束。开发者现在追求的是“更聪明、更小巧、更快速”。通过聚合这些多样化的模型, 让您只需一行代码即可在用于创意写作的 Claude 和用于技术资产生成的 Qwen 之间无缝切换。

“鹈鹕测试”不仅仅是关于鸟类的绘图,它关乎高端推理能力的平民化。无论您是在本地运行,还是通过 的高速基础设施调用,“本地”与“顶尖云端”之间的差距正在以超出预期的速度缩小。

访问 获取免费 API 密钥。

参考来源:https://simonwillison.net/2026/Apr/16/qwen-beats-opus/#atom-entries

小讯
上一篇 2026-04-18 10:03
下一篇 2026-04-18 10:01

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/267535.html