2026 年的马年春节,AI 的火药味甚至盖过了红包味。
字节、阿里、腾讯几乎同时把 AI 大规模推向台前:红包、免单、春晚互动、本地生活接入……都在争入口。与此同时,BAT 三家也在基础模型上连续出牌,视频生成(Seedance 2.0)、图像(Qwen-IMAGE-2.0)、多模态、语音模型密集更新,几乎没有空档。
不过,基础模型的对抗也从字节、阿里、腾讯等巨头迅速蔓延到了 DeepSeek 和「AI 小龙」们。
2 月 11 日晚,DeepSeek 新模型版本全面上线,继续把长上下文与复杂任务能力往前推;几乎同一时间,智谱推出新一代旗舰 GLM-5,强调 Agent 与编程能力;MiniMax 也带来了 MiniMax M2.5,延续多模态与应用导向路线。
三家几乎在同一时间点出手,让这场春节 AI 大战的「模型交锋」又升级了一个档位。
巨头双线推进,既抢入口也抢模型;创业公司聚焦底层能力,把筹码压在基础模型上。真正决定 2026 年甚至未来几年的竞争,正在这里展开。
春节 AI 大战:前线发红包,后端拼模型
2 月 12 日,阿里千问宣布「春节 30 亿大免单」上线 6 天完成 1.2 亿笔 AI 下单,用户说了 41 亿次。稍早前,腾讯元宝则宣布春节活动启动 5 天,元宝 AI 生图功能日均调用增长 30 倍,时长增长超 80%。
图片来源:千问、元宝
如果说今年春节 AI 大战前半段是纯粹的入口之争,后半段则是更为复杂,从巨头到初创大模型公司,都在集中发力基础模型的迭代。
这一点其实雷科技在之前的报道《一切为了Agent:千问、阶跃、Gemini打响「3.5模型大战」,春节将成关键节点?》就有提到,包括:
- 海外的 GPT-5.3-Codex 和 Claude Opus 4.6;DeepSeek V4大招还没发,把「长上下文」做深是亮点
- 国内已经发布的 Kimi 2.5、Step 3.5 Flash、SeedDance 2.0、Seedream 5.0;
- 刚刚发布的 GLM-5、MiniMax M2.5、DeepSeek V3 系列更新;
- 还有箭在弦上的 Doubao 2.0、Qwen 3.5、Gemin 3.5。
考虑到 DeepSeek 并没有发布官方博文,这一次更新的 DeepSeek 新模型大概率不是 V4,而是 V3.2 系列的更新(或为 V3.5)。
不过这也可以看作 V4 发布前的「灰度版」,因为按照 The Information 的最新爆料,DeepSeek V4 内部初步测试显示,其在模型的编程能力了已经超越了 Claude(没有指出具体模型)。
而从网友们统一收到的 DeepSeek 回复来看,DeepSeek 新模型的变化集中在两点:百万级长上下文和知识库更新。
首先是上下文窗口从之前的 128K 直接拉升到了 1M(100 万 Token),你可以一次性把《三体》全集或者一整个项目的代码仓库塞给它。测试显示,它处理这类长文档的响应速度非常快,不再需要手动拆分文件。
另外,DeepSeek 新模型的知识库也更新到了 2025 年 5 月,但依然不支持多模态——无法理解图片(文字内容除外)和视频,也符合 DeepSeek 一直坚持的「语言模型」路线:
不追求炫目的多模态,而是把文本推理、工程任务这些高频刚需做到极致。
而上下文长度的大幅提升,不仅长文档处理与多轮推理能力更稳定,理论上也会改善长代码理解、多步骤分析等复杂场景执行表现。
时隔 1 个多月迭代,智谱 GLM-5 把 Agent 推到台前
相比之下,GLM-5 作为原生 Agent 基座模型的升级更具「代际感」。虽然距离去年底发布 GLM-4.7 仅仅过去 1 个多月,但智谱年初上市时候预告的新一代模型,确实升级不小。
这一代模型的核心关键词不再是对话,而是 Agent 与编程能力,也规格已经明显向「Agent 基础模型」靠拢:上下文达到 200K 级别,最大输出可达 128K,模型规模进一步扩大,训练体系也做了重构。
但真正的变化还是发生在能力结构上。
GLM-5.0 被直接设计为可执行任务的 Agent 模型,强调编程能力、工具调用与长流程执行。在编程测试中,它已经能处理项目级代码与调试问题,模型可以拆解需求、调用接口、持续执行任务,并在多阶段过程中保持目标一致。
继续押注多模态,MiniMax M2.5依然坚持生产至上
MiniMax 从模型到应用的垂直路线,依旧与前两者拉开距离。
MiniMax M2.5 的升级重点仍然放在多模态与内容生成能力,但强调的一整套多模态能力的推进,包括语音生成、音乐生成与文本能力同步提升,强调可直接进入创作与产品流程。
模型继续采用 MoE 架构,在保持规模的同时控制推理成本,更适合部署在应用侧。语音克隆、情绪表达、音乐生成质量的提升,使它更接近「生产工具」,而不是推理模型。
MiniMax 的定位因此也很清晰——不是去比谁最聪明,而是更偏向让模型在内容生产环节真正可用,生成内容、参与创作、进入产品流程。
这条路径也决定了 MiniMax 的目标不是 benchmark,而是可落地的生产能力。
三家模型的路径差异由此变得非常具体:DeepSeek 把长推理能力做到极致,智谱把模型推向 Agent 工程形态,MiniMax 则把多模态生产能力做成基础设施。它们不再围绕同一套指标竞争,而是在不同能力方向上构建各自的模型形态。
但共性同样明显。参数规模不再是核心卖点,聊天体验也不再是主要目标,所有升级都在指向一件事——模型要能参与真实任务,而不仅是给出答案。
DeepSeek 炸场一年后,「AI 小龙」位次已剧变
把时间拨回到去年春节,DeepSeek-V3 和 R1 的开源发布,冲击了全球 AI 格局,也成为「AI 小龙」阵营的分水岭。
关键不只是「模型很强」,更在于成本被重新定义。低成本、高性能的推理模型开始出现后,行业对基础模型的预期突然变了——不只是要求严格训练出一个模型,而是要求更低成本的更强模型。
剧烈的模型竞争加速,再加之训练算力的匮乏,直接引发了「AI 小龙」阵营的明显分化。百川和零一几乎已经退出「前沿基础模型」的主战场:前者转向医疗等垂直方向,后者更多走企业与行业场景路线,更新节奏明显放缓。
当基础模型进入高投入、高密度迭代阶段,只有极少数团队还能长期承受算力与研发压力。
不过今年的情况又有些不一样,最直接的一点就是 DeepSeek V4 至今没有发布。从外部看,可能有两种解释。
一种是技术层面的现实:推理能力、长上下文、工程稳定性这些方向本身难度更高,模型要跨出一整代的差距,需要更长周期,而且之前也传出过 DeepSeek 在训练过程遇到难题。另一种则是更偏策略性,不只是跟着友商一起发布,而是作为压轴登场,形成宣发上的优势。
还有一个更容易被忽略的变化是:今年春节,DeepSeek 要面对字节、阿里、腾讯在模型上的高强度投入,以及全球模型的快速迭代,最直观的例子就是最近引爆全球的字节 Seedance 5.0 视频模型。
Seedance 5.0 生成,图片来源:bilibili
当然,还在活跃的「AI 小龙」也在第一线持续推进基础模型的迭代,智谱 GLM 和阶跃星辰 Step 更多还是集中在模型,面向行业提供更创新、更实用的基础模型。
MiniMax 和月之暗面 Kimi 则更多主打「模型即应用」,不只打造模型,也在发力自己的原生 AI 应用,MiniMax 更是形成了一定的产品矩阵,但二者都在从基础模型到应用进行垂直整合。
这不是简单的「谁强谁弱」,而是一种更现实的分化。
写在最后
2026 年的春节还没正式开始,但大模型下半场的发令枪已经响得震耳欲聋。
从巨头们的「撒币」入口战,到 DeepSeek、智谱、MiniMax 在初四晚上的模型突袭,这场仗的打法变了。大家不再执着于在 Benchmark 上刷分,而是开始比谁能更深地嵌入真实生产力:是吞下百万行代码的胃口,是自主跑通工程的双手,还是理解人类情绪的耳朵。
DeepSeek 这次虽然没祭出传说中的 V4,但这记「1M 上下文」的长拳,依然也让不少空谈 Agent 却解决不了长程记忆的对手感到脊背发凉。而智谱和 MiniMax 的如期对垒,则证明了「AI 小龙」们已经从去年的防守反击,转向了更有底气的差异化进攻。
悬念依然存在。DeepSeek 憋了许久的 V4 究竟是在等一个「一力降十会」的压轴时刻,还是在攻克某种未知的技术天花板?在大厂与小龙的混战中,谁能率先把「模型能力」真正转化为「商业护城河」?
但有一点是肯定的:2026 年,单纯靠「会聊天」已经拿不到门票了。烟花散去,留在牌桌上的,只能是那些能真正卷入工作流的狠角色。
热门跟贴