除夕夜,春晚还没开始,AI 圈先炸了。

过去半个月,中文互联网上演了最魔幻的一幕。上亿人对着千问 APP 疯狂输出,只为薅那一杯免费奶茶。

30 亿真金白银砸下去,效果简单粗暴:登顶 App Store,日活 7352 万逼平豆包,6 天 1.2 亿单 AI 订单。阿里用一种最简单粗暴的方式,完成了大模型在 C 端的一次全民普及。

打开网易新闻 查看精彩图片

但互联网有一条铁律:靠补贴拉来的用户跑得比谁都快。当「一句话办事」的新鲜感褪去,如何让流量变留量?答案只能是更好的模型体验。

打开网易新闻 查看精彩图片

没有让我们等待多久,阿里刚刚正式发布并开源了 Qwen3.5 系列模型, 并迅速在 chat.qwen.ai 平台完成部署。

页面显示有两款模型,分别为最新大语言模型的 Qwen3.5-Plus,以及定位为开源系列旗舰的 Qwen3.5-397B-A17B。两者均支持文本处理与多模态任务。

打开网易新闻 查看精彩图片

流水的榜单,铁打的千问

过去两年开源模型界流传着一个梗:「流水的榜单铁打的千问」。从 Qwen 2.5 到 Qwen 3.5 每一代发布基本都是发布即霸榜,以至于开发者圈子处处流传着那个传说——「源神启动」。

基准测试结果显示,Qwen 3.5 在多模态理解、复杂推理、编程、Agent 智能体等几大核心能力维度都是领先于同级开源模型,多项基准媲美 Gemini-3-pro 等闭源第一梯队。

打开网易新闻 查看精彩图片

同时以 4000 亿参数的 Qwen3.5-Plus 性能超过了万亿参数的 Qwen3-max 模型。小马拉大车,还能跑得比高铁快。这是怎么做到的?我们找到了几个关键要素:

混合注意力机制:实现算力动态分配,让模型学会「有详有略」地提升长文本效率

极致稀疏 MoE 架构:总参数 397B 激活仅 17B,是同等性能参数量最小的模型,也就是说仅需激活不到 5% 的参数,即可调动全量知识大幅降低推理成本

原生多 Token 预测:将逐字生成改为多步联合预测,实现推理速度翻倍

系统级稳定性优化:精准调控信息流,确保模型在超大规模训练中不崩盘、不跑偏

除了这些,Qwen3.5 和字节的豆包大模型 2.0 都在尝试解决同一个问题:让 AI 真正理解图像、文字和视频。

Qwen3.5 通过早期文本-视觉融合与扩展的视觉/STEM/视频数据实现原生多模态,在相近规模下优于 Qwen3-VL。

Qwen3.5 通过异构基础设施实现高效的原生多模态训练:在视觉与语言组件上解耦并行策略,避免统一方案带来的低效。

利用稀疏激活实现跨模块计算重叠,在混合文本-图像-视频数据上相比纯文本基线达到近 100% 的训练吞吐。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

向左滑动查看更多内容

在此基础上,原生 FP8 流水线对激活、MoE 路由与 GEMM 运算采用低精度,并通过运行时监控在敏感层保持 BF16,实现约 50% 的激活显存降低与超过 10% 的加速,并稳定扩展至数万亿 token。

最终做出来的效果是, Qwen3.5 支持图像与视频输入,上下文窗口扩展至 1M tokens,可直接处理长达 2 小时的视频内容,还能像人一样操作手机和电脑,完成跨应用的复杂任务。

当然,最让开发者心动的,永远是价格。Qwen3.5-Plus 的 API 价格每百万 Token 低至 0.8 元,同等性能下,价格仅相当于 Gemini-3-Pro 的 1/18。

这次跑分没输过,体验也没输过

话不多说,直接开测。我们先甩给它一张发票,提取内容轻松拿捏,准确无误。

打开网易新闻 查看精彩图片

上下滑动查看更多内容

接着加大难度,来个「找茬游戏」,让它圈出两张图的不同。虽然没有直接在图上画圈,但它精准地指出了所有不同之处。这眼神,确实可以。

打开网易新闻 查看精彩图片

GPT-4o 前阵子正式「退役」,于是我把一个梗图甩给了它,它不仅看懂了图,还读懂了背后的嘲讽和情绪。这种对「潜台词」的理解,才是多模态的真正门槛。

打开网易新闻 查看精彩图片

遗憾的是,Qwen3.5 Plus 的写作能力并未得到较大提升,虽然逻辑通顺,但 AI 味还是肉眼可见,转折生硬,缺乏人类写作者的灵气与细腻。

打开网易新闻 查看精彩图片

上下滑动查看更多内容

编程能力或许是 Qwen3.5 给我的最大惊喜。恰逢春节,先来一个春节烟花模拟器,代码一次跑通,不仅视觉元素齐备,连音效都配齐了。这已经不是简单的代码补全,而是完整的代码生成。

打开网易新闻 查看精彩图片

再来一个年兽闯关塔防游戏,鞭炮防御,红色减速,NPC 互动,Q 版画风也都轻松拿捏。

打开网易新闻 查看精彩图片

我们也顺手做了一个给各位拜年的网页,提前祝大家新年快乐。

打开网易新闻 查看精彩图片

不吹不黑,就体感而言,Qwen 3.5 的编程能力,无论是代码的审美、完成度,还是出错后的自动修复能力,绝对处于当前开源模型的第一梯队,甚至可以媲美顶尖闭源 AI 模型。

是的,春节的假期总会结束,薅来的奶茶也总有喝完的一天。

30 亿的补贴或许能换来一时的数据狂欢,但无法筑起真正的护城河。在这个模型迭代以月为单位的周期,唯有硬核的模型能力和极致的性价比,才是留住开发者和用户的根本。

开源、低价、具备原生多模态能力的 Qwen3.5 系列,或许才是阿里送给全球开发者和亿万用户最好的一份新年礼物。

除夕夜的这颗「源神」炸弹,或许正是 2026 年 AI 竞争格局的预演。

去年,DeepSeek V3 用一场「以小胜大」的奇袭,彻底改写了全球 AI 叙事,今年 Qwen3.5 再次证明了另一条路的可能性——用技术创新,而不是参数堆砌,来实现更强的智能。

而这个除夕夜,春晚的舞台上或许有精彩的表演,但真正的「年度大戏」,正在 AI 赛道上演。

欢迎加入 APPSO AI 社群,一起畅聊 AI 产品,获取,解锁更多 AI 新知

打开网易新闻 查看精彩图片

我们正在招募伙伴

简历投递邮箱 hr@ifanr.com

✉️ 邮件标题 「姓名+岗位名称」(请随简历附上项目/作品或相关链接)

打开网易新闻 查看精彩图片