4月的大模型竞赛,先被阿里拉开了序幕。
此前,我们独家获悉 DeepSeek V4将于4月发布。消息传出后,市场预期迅速升温。尤其是清明节前,围绕 DeepSeek V4何时亮相的讨论持续发酵,几乎成了AI圈共同等待的一件大事。
但率先出牌的不是DeepSeek。就在这一节点上,阿里连续三天发布三款模型,覆盖全模态、文生图和代码能力,迅速接管了节前AI圈的话题中心。
3月30日Qwen3.5-Omni、4月1日Wan2.7-Image、4月2日Qwen3.6-Plus,72小时里,阿里的全模态、文生图、编程三大核心模型陆续更新。据悉,4月3日,全球知名大模型盲测榜单LMArena旗下聚焦编程能力的Code Arena公布新一期排名,Qwen 3.6-Plus位列全球第二,超越OpenAI、Google、xAI等国际巨头,成为该榜单上排名最高的中国大模型。
而这距离阿里AI事业部(ATH)正式成立,才刚刚过去两周。这说明新事业群的意义不只是整合资源,在重视基础模型的同时,更强调阿里AI能力和矩阵的连续供给,保持在新一轮模型竞赛中的领先位置。
这次密集发布固然叠加了多重因素,但本质上还是阿里在大模型领域长期投入的结果。早在2019年,阿里就是国内较早投入大模型方向的公司,2021年更是在全球范围内率先大幅降低万亿参数超大模型(M6大模型)的训练能耗。
随后几年,从达摩院到通义实验室,前者负责打底层研究,后者负责把模型做成系列和持续迭代的产品能力。千问(Qwen)系列模型不断壮大,阿里更是在大模型AGI路线上,不仅夯实了技术底座,也为后续大模型的产品化与商业化落地奠定了坚实基础。
组织上,阿里建立了常态化的人才培养机制。与国内外多所高校共建联合实验室,同时引进了一批在多模态、强化学习、智能体等前沿方向有积累的研究者。这也保证了通义实验室长期形成的结构稳定、层次清晰的人才梯队。
正是过去几年在研究、工程和组织上的连续投入,让阿里AI整体的推进保持稳定节奏。从模型性能的显著提升,到应用端的同步上线,再到对Agent赛道的提前布局,我们能看到,阿里大模型的迭代不是单点突破,而是模型研发、系统能力和产品相互促进的完整链路。
01
三天三款SOTA
这次阿里AI的集中更新,最突出的地方不是连发三款模型,而是每一款都在对应赛道交出了领先行业的成绩。
例如在编程赛道上,Qwen3.6-Plus相较于上一代模型整体性能提升明显,并且涌现出很强的智能体编程能力。在系列编程能力权威评测中,千问3.6编程表现超越2倍乃至3倍参数量的GLM-5、Kimi-K2.5等模型,接近全球最强编程模型Claude系列。
正是因为编程能力的显著提升,大模型才能更好地支撑AI智能体的运行,让代理式编程(Agentic Coding)真正落地。千问3.6在实测中展现出了完整的任务闭环能力,面对前端网页开发、大型仓库维护等复杂需求,它能自主拆解步骤、规划执行路径,并通过反复测试修改最终交付结果。
此外,它在代码修复、终端操作、自动化任务执行等工程环节表现稳定,在多个行业公认的高难度长程任务中取得了领先成绩。
最大的亮点还是Qwen3.6-Plus的原生多模态能力,直接解锁了“视觉智能体编程”的想象空间。例如,设计师上传一张界面截图或Figma设计稿,模型就能自动拆解任务、生成前端代码、调用工具调试修改,真正打通了从“看懂设计”到“交付产品”的完整链路。
再配合百万词元上下文和全Agent框架支持,曾经只存在于概念中的“氛围编程”,终于从噱头变成了普通人也能用的工具。
文生图赛道上,Wan2.7-Image具备文生图、图生组图、图像指令编辑和交互式编辑等全链路能力。尤其针对行业诟病已久的“AI标准脸”和“色彩盲盒”两大痛点,Wan2.7-Image给出了教科书级别的解决方案,从骨相、眼眸到五官的全维度定制,真正实现“千人千面”。
这次在全模态赛道上升级的Qwen3.5-Omni模型,表现更为惊艳。据阿里云官方测试后给出的数据显示,它在音视频理解、语音识别、多语种翻译等215项任务中取得SOTA,超越了谷歌Gemini-3.1 Pro。
02
阿里AI的“变”与“不变”
这场备受行业关注的三连发,看似是ATH成立后的突然爆发,实则是阿里七年大模型积累的必然结果。背后是阿里AI不变的技术底蕴,结合动态变化的组织逻辑。
所谓不变的技术底蕴,包括阿里深耕大模型的长期主义和体系化能力。早在2019年,阿里就启动了大模型研发,是国内最早布局这一领域的企业之一。
七年里,阿里沉下心来做底层能力建设。在算力层面,依托阿里云构建了国内领先的大模型训练与推理集群,为持续迭代提供了稳定的基础设施支撑。技术层面,逐步打通了自然语言处理、计算机视觉、语音识别、多模态融合等多个技术领域的壁垒,形成了从基础算法到工程落地的完整技术栈。
经过七年的人才培养和技术沉淀,通义实验室已经形成了完整的人才梯队,而不是依赖少数人。
此前行业曾有传言,部分人员流动会影响阿里的研发节奏,这次三连发直接打破了这种质疑。万相团队独立突围拿下国内生图第一,千问团队同时推进全模态和编程两条线,证明阿里的技术储备早已实现了多点开花,个别人员的流动难以撼动根基。
变化的是,阿里AI的发展逻辑和组织方式。ATH成立之前,阿里的大模型、应用、云服务曾存在一定的“各自为战”现象,模型研发偏向实验室导向,与市场需求存在脱节。
而ATH的成立,彻底打通了从算力、模型到应用的全链路壁垒,从组织架构思路上对标谷歌的DeepMind机构,将大模型转型为产品驱动研发,研发提升产品的闭环逻辑。
ATH是阿里"全栈AI服务商"战略的重要组成部分,与阿里云智能事业群、电商事业群平行,成为阿里三大核心事业群之一。阿里巴巴集团CEO吴泳铭将其核心目标定义为"创造Token、输送Token、应用Token",构建Token从生产到消费的完整闭环。
吴泳铭明确判断,当下正处于AGI爆发前夜,AI的核心交互方式正在从"问答式"转向"代理式"。未来大量数字化工作将由数以百亿计的AI Agent来支撑,而Token是支撑智能体运行的核心能量单位,相当于AI时代的石油。
在这种理念指导下,阿里AI从实验室思维全面转向市场导向。从这次发布的所有功能也能看出,几乎没有一个是为了跑分而设计的,调色盘解决了设计师的配色痛点,音视频处理解放了内容创作者,Agent编程降低了普通人的开发门槛。
除了模型更新,对“龙虾热”的快速反应,如悟空、Qoder等Agent产品的密集迭代,更是体现了阿里对市场需求的嗅觉。
在强调AI应用的大年里,模型研发也不能再走闭门造车的老路,而是与应用团队深度联动。我们发现,比模型性能更值得关注的,是阿里这次展现出的“模型-应用”协同速度。应用团队把用户需求反馈给模型团队,模型团队快速迭代优化,再通过阿里云百炼这个统一出口,同步给所有开发者和企业用户。
千问3.6发布当天,ATH旗下的悟空、千问APP、Qoder等产品就全部官宣上线。这种“零时差接入”的能力,在整个行业都很罕见。
这意味着阿里发挥出自身的组织优势,完成了从“单点突破”到“协同作战”的战略转变,也让阿里的技术优势能够快速转化为产品优势和市场优势。
03
大模型需要和产业更深地连接
2026年初,开源项目OpenClaw突然引爆全球科技圈,几乎成为继ChatGPT之后AI领域又一个具标志性的现象级事件。
这个由海外独立开发者团队打造的轻量级Agent框架,无需对接任何平台的专属API,仅通过模拟人类鼠标、键盘操作,就能直接控制电脑完成机票酒店预订、邮件批量处理、PPT自动生成与发送等一系列复杂的跨应用任务。
它真正改变行业认知的地方在于,第一次向大众直观展示了AI是如何蜕变成“执行者”的,不仅能够理解人类的自然语言指令,还能自主拆解任务、规划执行路径、处理突发异常并完成最终交付。
这一趋势也倒逼大模型研发逻辑发生转变,也就是说,模型研发不能脱离产业。此前行业的竞争重心集中在参数量、上下文窗口长度、基准测试跑分等纯技术指标上,但在Agent时代,模型的核心竞争力变成了工具调用的精准度、长程任务的规划能力、错误回溯与修正能力,以及与真实世界交互的鲁棒性(Robustness)。
阿里巴巴集团CEO吴泳铭是在2026年3月19日的财报电话会上指出,2025年下半年以来,AI技术已进入由"AI Agent"驱动的新阶段。
他强调,与早期AI阶段最大的区别在于,模型与应用之间的紧密配合变得至关重要,提升模型能力、改善应用效果的关键,越来越依赖于这种紧密结合以及在客户使用场景中形成的数据闭环。
所以,阿里的这次三连发,证明了ATH成立后,大模型到AI应用的协同效应正在生效。同时也是为了验证,阿里“产模一体”后取得的初步成果。
今年以来,阿里的核心战略就是快速推进“产模一体”的进程。比如将AI的总称和核心品牌统一为“千问”,告别“通义”前缀,仅保留“通义实验室”作为AI机构组织名称。
这一品牌整合是“产模一体”战略的一部分,目的是将大模型能力更紧密地与C端应用(如千问App)和B端产品(如悟空)结合,做大用户规模。
作为阿里企业级AI旗舰应用,“悟空”率先接入了最新的Qwen3.6-Plus模型,将模型的智能体编程、长程任务规划等能力,直接应用于企业研发、知识管理、业务流程自动化等真实工作流中。这是“产模一体”的典型实践。
设立ATH(Alibaba Token Hub)事业群同样如此。将通义实验室、MaaS平台、千问、悟空智能体等核心AI资源进行整合,是为了打通“模型—应用—数据”的全链路闭环。
此外,阿里正将千问大模型深度嵌入淘宝、高德、飞猪等生态业务中,并推出千问AI眼镜等硬件产品。这些产品不仅是模型的应用场景,也是用真实数据反哺模型迭代,形成数据飞轮。
这也印证了一个朴素的道理,技术是基础,组织力或许才是决定胜负的关键。再先进的技术,如果卡在了部门墙和繁琐流程里,也没法变成实实在在的产品和用户价值。
阿里成立ATH,正是对这个问题的直接回应。
对于普通用户来说,阿里这次模型三连发,意味着AI平民化时代正在加速到来。未来,编程不再是程序员的专利,普通人用自然语言就能开发自己的APP。内容创作不再需要专业技能,人人都能成为设计师和导演。全模态交互的AI助手,将真正融入我们的工作和生活,成为每个人的超级生产力工具。
未来,阿里AI的花路会越走越宽。据悉,千问3.6系列还将开源其他尺寸模型,性能更强的旗舰模型Qwen3.6-Max也将于近期发布。可以看到的是,在ATH的统一指挥下,阿里AI通过协同已经重新找到一种更强劲的节奏。
撰写|吴寻
编辑|刘培
热门跟贴