据多家国内外媒体爆料,DeepSeek 计划于下周发布最新一代大语言模型 V4,这是该公司自上一款重磅产品推出一年多以来的首次重大更新。
有网友预测,具体的发布时间将可能在周一(3月2日)的早上10点半。
回顾历史,DeepSeek R1在2025年1月发布时,恰逢农历新年期间,当时对市场产生了巨大的冲击效应。选择在周一上午发布,可以看作是延续这个"剧本",在新一周的开始抢占全球科技媒体的头条,实现最大程度的曝光和影响力。
此外,北京时间周一上午10:30,正好覆盖了欧美周日晚间的黄金时段和亚洲市场周一开盘后的活跃期,能让全球媒体、分析师和投资者在同一天内充分消化信息,形成持续的讨论热度,最大化传播效果。
据两名了解内情的人士透露,DeepSeek此次推出的 V4 将是一款具备图像、视频与文本生成能力的多模态模型。 多名知情人士称,DeepSeek 已与中国本土 AI 芯片厂商华为和寒武纪展开合作,对 V4 进行定制优化,以适配双方最新一代芯片产品,从而在算力层面形成更紧密的协同。
值得注意的是,根据爆料内容来看,英伟达和 AMD 没有拿到权限。这一动作被视为中国科技企业加速摆脱对英伟达高端 AI 芯片依赖的又一信号,而这些芯片目前正受到美国出口管制限制,相关措施旨在遏制中国的技术崛起。
这打破了 AI 领域一个长期惯例。以往 AI 公司在发布重大模型之前,都会把预发布版本交给英伟达做软件适配和性能优化。DeepSeek 之前也和英伟达有密切合作。
这次,选了华为。
英伟达和 AMD 拒绝置评,DeepSeek 和华为官方也没有回应。
2月下旬,多则DeepSeek 新模型的爆料就已经在 AI 社区传开了。
一位叫 Legit 的开发者曝出,「V4 Lite正在积极测试中,至少有一家算力服务商已经拿到访问权限,签了严格的保密协议。」
「模型代号sealion-lite,上下文窗口 100 万 tokens,原生支持多模态推理,效果远好于目前 Web 和 App 端的模型。」
另外一位叫 Fandu 的网友更是晒出了疑似 V4 Lite 生成的 SVG 示例,迅速被疯狂转发。
其中一组对比强烈。
用同一个提示词画 Xbox 手柄,V4 Lite在非思考模式下生成的 SVG 细节丰富,多个按键和转轴都清晰画了出来。而V3.2在思考模式下画的手柄,过于简单。
V4 Lite不开思考就比V3.2开了思考还强。甚至有报道称在 SVG 代码上,V4 Lite已经超过了Claude Opus 4.6和Gemini 3.1。
你看好Deepseek V4 新模型吗?欢迎在评论区留言讨论。