DeepSeek V4到底何时发布?不少人都在好奇和关注这一点。
之所以DeepSeek V4吊起了这么多人的胃口,主要是其发布时间已出现一再延期的现象。
原本在今年1月份时,传出发布时间在春节期间,但当时没有发布。时间来到3月份,有消息称定在同月的十几号,可到了3月30日还没有发布。还有消息称,其将于4月正式上线。
这一次,“靴子”会准时落地吗?
1
DeepSeek V4距离上一次产品发布更新,已经过去三个月了。这在更新飙速的2025年,是不可想象的。
人工智能的技术迭代到底有多快?人们开玩笑地称,不学或许是一种抵抗焦虑的方法。因为往往现实是,这个技术新品刚刚摸到点门道,下一秒已经过时了。
DeepSeek作为开源模型的“一代宗师”,势必成为大众关注的焦点。其距离现在最近的一次发布,是2025年12月1日DeepSeek V3.2发布。那之后便是一些修修补补类的更新,DeepSeek V4的发布时间则一再延期。
此前的2025年,DeepSeek的发布节奏大概维持在月更或两月一更的状态。2025年一年的时间里,DeepSeek陆陆续续发布了V3系列、R1推理模型、V3.2-Exp(稀疏注意力)、V3.2正式版等等模型。
让人留意的是,整个人工智能行业的大方向,正从模型发布比拼转向智能体能力。这与日前林俊旸在离开阿里后首度发长文提到的内容颇为一致。
在林俊旸看来,人工智能时代,正从“推理式思维”转向至“智能体思维”。
林俊旸在文中回顾了OpenAI的o1和DeepSeek R1,在整个人工智能时代当中的符号意义,即证明和推广了推理概念,然而未来这不再是时代主流。
林俊旸认为,未来的主流方向是“智能体思维”。其特点便是,在与环境的交互中不断修正计划。林俊旸将其形象地描述为:不再是“想更久”,而是“为了行动而想”。
让人印象深刻的是,林俊旸在文中认为,未来更好的模型,仅仅是其中之一的竞争力,而非全部,更好的环境设计、更强的harness工程以及多个智能体之间的编排,都将成为未来不可或缺的竞争力。
比拼模型发布已经不再是重点,重点是如何让模型实现“连续干活”。
这个时候,DeepSeek V4的发布一再延期,似乎就是情理之中的事情。
2
Agent时代到来,从梁文锋以及DeepSeek的近况来看,他们已经开始逐渐转变了方向和重点。
据爆料,梁文锋的研究方向,近半年来主要锁定了两个重点,一个是模型的视觉内容处理,另一个则是AI搜索。
去年底发布的DeepSeek V3.2,其明显特征是重点锁定tool-use和agent训练数据。按官方说法,其引入了覆盖1800+真实环境、8.5万+复杂指令的agent训练数据合成方法。
这意味着什么?在DeepSeek V3.2身上,就已经显现DeepSeek将目标锁定在训练一个“真正可执行的系统”,而非训练“更聪明的模型”。
上述转变,在梁文锋带领团队新发布的论文当中也可窥一二。
2026年1月其发布的一篇署名论文则提出了条件记忆机制,稍早一点,2025年底,一篇署名论文呈现优化Transformer记忆与长上下文瓶颈的成果。
据爆料,DeepSeek V4可能将在多模态、长期记忆、代码能力跃升等几个方面呈现其特点。另外其还会深度适配国产芯片,比如向华为等国内厂商提供提前访问权,以支持其优化处理器软件,确保模型在硬件上高效运行。
若如爆料所述,可能即将发布的DeepSeek V4,不再单单是一个更强模型,而是一个涉及模型、工具、工作流以及生态的系统工程。
近来,模型领域的创新速度其实是越来越快的。一些海外大模型比如OpenAI和Anthropic,到了2026年更新速度明显加快,甚至赶上2025年DeepSeek的更新状态。
为什么DeepSeek却变慢了?除了上述重点创新方向的转变,创新难度加大之外,就是开源模式比闭源模式压力更大。出牌若无大创新,这个牌反而不出更好一些。这恐怕也是DeepSeek V4一再延期的原因之一。
热门跟贴