4月29日,阿里云宣布开源Qwen3系列模型,包括旗舰版Qwen3-235B-A22B、Qwen3-32B、Qwen3-30B-A3B等多个尺寸。其中,Qwen3-235B-A22B作为旗舰MoE模型,仅激活22B参数即在多项基准测试中超越DeepSeek-R1、o1等模型,展现了极强的性能。
Qwen3系列采用混合专家架构,支持思考模式与非思考模式切换,训练数据覆盖超36万亿token,支持119种语言和方言。此次开源还包含Qwen3-30B-A3B等小尺寸MoE模型,可在单张消费级显卡上运行。阿里云表示,Qwen3系列在数学、编程、多语言理解等领域全面领先,为开发者和企业提供了高效、低成本的AI解决方案。