2026年Qwen3参数概览:从0.6B到235B,混合推理与多模态的极致平衡(附本地部署参数推荐)

Qwen3参数概览:从0.6B到235B,混合推理与多模态的极致平衡(附本地部署参数推荐)模型名称 总参数量 激活参数量 架构类型 上下文长度 支持语言 许可证 主要特性 Qwen3 235B A22B 2350 亿 220 亿 MoE 128K token 119 种 Qwen License 旗舰模型 编码 数学 通用能力媲美 DeepSeek R1 Grok 3 高效推理 Qwen3 30B A3B 300 亿 30 亿 MoE 128K token 119 种 Qwen License

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

 模型名称 总参数量 激活参数量 架构类型 上下文长度 支持语言 许可证 主要特性 Qwen3-235B-A22B 2350亿 220亿 MoE 128K token 119种 Qwen License 旗舰模型,编码、数学、通用能力媲美DeepSeek-R1、Grok-3,高效推理 Qwen3-30B-A3B 300亿 30亿 MoE 128K token 119种 Qwen License 小型MoE,性能超Qwen2.5-32B,推理成本低,适合本地部署 Qwen3-32B 320亿 320亿 Dense 128K token 119种 Apache 2.0 高性能密集模型,适合复杂任务,推理能力匹敌Qwen2.5-72B Qwen3-14B 140亿 140亿 Dense 128K token 119种 Apache 2.0 中等规模,平衡性能与资源占用,适合企业级应用 Qwen3-8B 80亿 80亿 Dense 128K token 119种 Apache 2.0 轻量高效,适用于边缘设备,性能媲美Qwen2.5-14B Qwen3-4B 40亿 40亿 Dense 128K token 119种 Apache 2.0 小型模型,推理速度快,性能接近Qwen2.5-7B Qwen3-1.7B 17亿 17亿 Dense 128K token 119种 Apache 2.0 超轻量,适合移动设备,性能匹敌Qwen2.5-3B Qwen3-0.6B 6亿 6亿 Dense 128K token 119种 Apache 2.0 最小规模,极低资源需求,适用于低功耗场景

小讯
上一篇 2026-03-13 17:46
下一篇 2026-03-13 17:48

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/216858.html