阿里开源新模型：350亿参数只开3亿，本地跑Agent有戏了

闪存猎手

2026-04-20 15:03 ·北京

「激活3B，总参35B」——阿里昨晚扔出的Qwen3.6-35B-A3B，把MoE（混合专家）架构的「抠门美学」玩到了极致。这不是参数竞赛，而是一场关于「算力性价比」的精准狙击。

一、MoE的「开关艺术」：为什么只激活3B？

混合专家架构的核心逻辑很简单：350亿参数全部加载，但推理时只叫醒3亿「专家」干活。其余参数沉睡，内存和算力压力骤减。

阿里官方数据很直白——Terminal-Bench2.0（终端编程）、NL2Repo（长程编程）、QwenClawBench（真实世界Agent能力）三项测试，新模型全面碾压自家前代Qwen3.5-35B-A3B，还能跟Gemma4-31B这类稠密模型掰手腕。

稠密模型（Dense）像全员待命的大公司，MoE像按需调用的外包团队。成本账一算，后者对本地部署友好太多。

二、多模态+Agent：本地「智能大脑」的拼图齐了

Qwen3.6-35B-A3B塞进两个关键能力：

多模态思考与非思考模式切换。MMBench、RealWorldQA、SimpleVQA等视觉语言测试中，表现追平Claude-Sonnet-4.5；空间智能测试RefCOCO、ODInW13分别拿到92和50.8分。

更实用的是框架兼容性——OpenClaw、Qwen Code、Claude Code等主流Agent框架直接能跑。编程能力+原生多模态，意味着本地设备可以处理更长程、更复杂的任务流，不用事事求云端。

阿里官方话术很精准：「有望成为本地部署的智能大脑」。翻译一下：别光盯着API调用了，你的笔记本可能够用了。

三、开源策略的「降维打击」：为什么是现在？

模型已上架魔搭社区、Hugging Face，Qwen Studio也能直接体验。开源节奏越来越快，版本号从3.5跳到3.6只隔数月。

背后是清晰的商业逻辑：当闭源大厂还在按token收费，阿里选择用开源占领开发者心智。35B总参、3B激活的甜点尺寸，恰好卡在「个人开发者跑得动、中小企业用得起」的甜蜜区。

对比Gemma4-26B-A4B（激活4B）和Gemma4-31B（稠密），Qwen3.6-35B-A3B的激活参数更少、总容量更大，性能却更优——这是架构效率的胜利，也是工程优化的肌肉展示。

四、谁该立刻上手？

三类人最该关注：想本地跑Agent的独立开发者、预算有限但需要多模态能力的创业团队、以及研究模型压缩和边缘部署的工程师。

3B激活量意味着消费级显卡可跑，350B总参又保证了能力上限。这不是全能模型，但它是特定场景下的最优解——尤其是需要代码生成+视觉理解+长程任务规划的复合场景。

去魔搭社区或Hugging Face下载权重，用Qwen Studio先跑通一个多模态Agent工作流。验证成本已经低到可以忽略，而错过窗口期的机会成本正在上升。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴