导 语
4月29日凌晨,阿里巴巴正式发布通义千问(Qwen)系列最新一代基础模型Qwen3,并全部开源8个尺寸的混合推理模型。涵盖混合专家(MoE)模型和稠密(Dense)模型,覆盖从6亿到2350亿参数的广泛尺寸规模。其中“旗舰模型”Qwen3-235B-A22B登顶全球最强开源模型,超越DeepSeek-R1、OpenAI o1 & o3-mini、Grok-3等一系列行业顶尖模型。并全系采用Apache2.0协议,无论对个人用户、开发者还是商业使用都极度友好。本文结合Qwen3的技术特点,以及阿里研究院对业界大模型发展的持续追踪,围绕基础大模型技术进步,对产业应用的形态创新、门槛降低、场景拓展、效率提升、普及加速等方面的推动与促进,进行综合分析探讨。
一、极大促进应用创新:基础模型对Agent(智能体)能力的支持程度,决定了我国Agent产业发展的高度
Agent(智能体)高度依赖基础模型对复杂任务的理解、多步骤规划和指令跟随等能力,可以说基础模型在Agent能力上的强弱,直接制约我国Agent产业的发展。
Qwen3专门增强Agent能力,增加对MCP协议的原生适配支持,并已于今年1月开源Qwen-Agent框架,内部封装了工具调用模板和工具调用解析器,为开发者提供极大便利。Qwen3作为国内首个专门针对Agent能力优化提升的顶尖模型,预期将为我国Agent生态发展提供更大助力。
二、极大降低应用门槛:优秀的模型具备最大化降低幻觉的能力,并在幻觉和泛化能力之间寻求最优平衡
模型的“幻觉”问题近期被广泛提及与研讨,也是制约其在低容错率应用领域普及使用的重要因素。在业界知名模型评估机构Vectara发布的“模型幻觉排行榜”中,DeepSeek R1推理模型的幻觉率可达14%,当前业界大模型的平均幻觉率接近7%,而行业顶尖模型的幻觉率可以控制在2%左右的水平。阿里Qwen2.5模型幻觉率为2.8%,而本次发布的Qwen3,业界实测要更低于之前版本,已处于业界头部水平。
Qwen3在后训练中,实施了一个四阶段的训练流程。在第一阶段通过大规模强化学习,利用基于规则的奖励来增强其探索和钻研能力,从而显著提升推理思考能力。在第四阶段,模型进一步在包括指令遵循、格式遵循和Agent能力等在内的20多个通用领域的任务上应用强化学习,进一步增强其通用能力并纠正不良行为。这种分阶段的强化学习方法,不仅帮助模型在复杂任务中表现出色,也通过纠正不良行为有效抑制了幻觉现象,使得Qwen3模型在推理思考时既有灵性又能保持准确性。
仍需强调的一点是,模型技术构架的特点决定了幻觉是模型创造能力的伴生品,幻觉的产生并不源自训练数据,也不属于虚假信息。不能以过分牺牲泛化这一重要性能来“削足适履”地管控幻觉,对幻觉的治理不是消灭而是控制,应通过模型训练的技术策略以及分场景适配等手段,在幻觉和泛化之间实现平衡。
三、极大拓展应用场景:完备的模型尺寸家族,为广泛的产业应用场景提供丰富选项
Qwen3系列模型通过提供从6亿到2350亿参数的多种尺寸版本,覆盖了从边缘设备到企业级数据中心的广泛应用场景,为产业应用的繁荣提供了强大的技术支撑。其中,6亿、17亿、40亿参数的几个小尺寸模型,在智能手机或平板上即可轻松运行;80亿参数模型则适用于个人电脑或智驾座舱;320亿参数模型则广泛适用各类企业进行灵活部署;而2350亿参数的旗舰模型,则适合需要极致性能的场景,如科研、大型企业应用等。
更难能可贵的是,Qwen3的这8款开源模型,都做到了每一个尺寸规模领域的业界最强,为千行百业、百花齐放的产业应用,提供丰富的可选项和强大的推动力。
四、极大提升应用效率:MoE架构实现极致性能和高效推理完美平衡
Qwen3系列模型中,有两款尺寸引入了混合专家(MoE)架构,以实现极致性能和高效推理的完美平衡。以旗舰模型Qwen3-235B-A22B为例,其总参数量达到2350亿,但在推理时仅激活220亿参数。这种架构设计不仅大幅降低了计算资源的消耗,还使得模型在推理速度和性能上表现出色。此外,Qwen3的MoE模型在保持高性能的同时,进一步降低了部署与使用成本。Qwen3-235B-A22B仅需4张H20显卡即可实现满血版部署,显存占用仅为性能相近模型的三分之一。这种高效的设计使得Qwen3系列模型不仅在性能上超越了DeepSeek-R1、OpenAI o1等顶尖模型,还为开发者和企业提供了更具性价比的选择,极大地提升了应用效率,推动了大模型技术在更多场景中的广泛应用。
五、极大加速应用普及:全系采用Apache-2.0开源许可协议,最大化维持使用开放性和生态可控性
Qwen3系列模型均采用了Apache-2.0开源许可协议,维持了最大限度的使用开放性和生态可控性。目前Apache-2.0协议是使用最多的开源模型许可协议,在Hugging Face上有超过27万个模型使用该协议进行开源,约有10万个模型使用了限制最少的MIT协议,相较而言Apache-2.0协议增加了下游开发过程中对模型状态调整进行通知的要求,在保障利用自由的同时也保护了模型的完整性和可控性,有利于提高模型开源生态的透明度,帮助各方有效管理开源模型的使用。此外,Qwen3对8个尺寸的模型均采用了统一的开源协议,不设置用户规模上限等商业保留,不对模型生成内容或衍生模型进行额外要求,也没有对最强模型的使用进行限制,为开发者利用Qwen3进行蒸馏、微调,开发适合各类型场景的衍生模型提供了最大程度的技术便利和资源支持。
六、模型自身能力演进以及和云+芯的协同联动,将为产业应用繁荣与普及提供原生动力
首先,模型本身在类人思考和多模态领域将持续演进提升。Qwen3作为全球首个开源的混合推理模型,融合了“推理”和“非推理”模式,能够根据不同问题选择“快思考”和“慢思考”。以及阿里在3月发布的Qwen2.5 Omni模型在端到端多模态方向上的积累和提升,使其能够更好地理解和生成多种模态的内容,为未来的智能应用提供了更强大的能力支持。上述融合提升揭示出更深层面的演化趋势,即我们正在见证模型领域“大一统”的过程。无论是思考模式、还是各种模态的融合统一,都在近期飞速发展,这对于模型向真正的通用人工智能(AGI) 演进,具有极为重要的推进意义。
同时,模型技术与云基础架构、芯片架构的协同演进正成为推动产业技术进步的关键。大模型的发展与云体系的支撑密不可分,无论是训练还是推理,每一次模型能力的突破背后,都是云计算、数据和工程平台的全面配合与升级。以及,在Qwen3发布的短短几个小时后,昇腾社区即宣布其国产算力集群适配Qwen3模型,模型算法与芯片硬件的紧密协同,揭示出当前的模型与芯片的关系,正在从“模型适配芯片”向“模型优化芯片”乃至“模型定义芯片”快速演进。
版块介绍 —产业之声
紧跟产业发展脉搏,我们汇集行业领袖与企业的真实声音,在算力基础设施的规划与布局、能耗优化、大模型能力发展、大模型评测体系、产业应用案例深入研究、新技术与应用趋势前瞻探索等方面,剖析成功案例背后的逻辑与挑战,并提供基于产业深度洞察的策略建议。同时,我们依托于阿里巴巴集团在人工智能领域的全面布局,分享阿里的AI产业生态和应用的实践落地,探讨技术如何重塑产业格局并推动社会经济的转型升级。
Reading
1、
2、
3、
4、
5、
6、
7、
8、
9、
10、
11、
12、
13、
14、
15、
16、
17、
18、
19、
20、
21、
22、
23、
24、
25、
26、
热门跟贴