4月24日,DeepSeek突然发布最新模型DeepSeek-V4预览版,距离上一代模型DeepSeek-V3上线已有15个月。
新模型延续了“性价比”的传统优势,DeepSeek还新增适配华为昇腾等国产芯片,打破了英伟达的AI统治力。
在“国模+国芯”行业趋势下,这款备受瞩目的新模型能否重现“DeepSeek时刻”?
能力稍逊最顶尖模型
DeepSeek-V4按模型大小分为Pro和Flash两个版本,但都拥有100万字超长上下文的能力,相当于一次性可以阅读4000页书。
技术文档还披露,V4-Pro的性能比肩顶级闭源模型,已达到当前开源模型最佳水平,尤其是智能体能力显著增强。
记者了解到,DeepSeek内部已提前使用V4-Pro的智能体编程模型,据评测反馈使用体验优于美国大模型Claude Sonnet 4.5,但仍与最顶尖大模型Opus 4.6思考模式存在一定差距。
部分测评中,DeepSeek-V4性能比肩顶级模型。
另外,V4-Pro具备丰富的世界知识,大幅领先其他开源模型,但在测评中仍稍逊于顶尖闭源模型谷歌Gemini-Pro-3.1。而在数学推理性能中,V4-Pro超越当前所有已公开评测的开源模型,与闭源模型能力不相上下。
有业内观点认为,DeepSeek的发展轨迹落后于全球最前沿模型3个月左右。
由于模型参数和激活量更小,V4-Flash性价比更高。在智能体测评中,V4-Flash在简单任务上与V4-Pro 旗鼓相当,但在高难度任务上仍有差距。
值得一提的是,V4采用了DeepSeek自研“黑科技”DSA(稀疏注意力)技术。传统模型处理长文本有个“老大难”,计算量会随文本长度爆炸式增长,导致大模型输出内容直接崩溃。而V4通过DSA压缩词元,让模型学会“抓重点”,只关注关键信息,从而实现了长文本处理速度和显存效率的飞跃。
“V4是‘价格屠夫’,定价只有GPT-5的1/18,Opus 4.6的1/16。”一名提前试用的开发者表示,相对于DeepSeek-V3来说,V4的成本上涨40%左右,但推理质量提升明显,“仍是一笔划算的买卖”。
“去英伟达”的关键一步
由于提前适配了国产芯片,DeepSeek-V4发布后,国产AI芯片股拉升,华虹公司、海光信息一度逼近涨停,中芯国际、寒武纪等个股也同步走强。
在技术报告中,DeepSeek提到,在英伟达GPU和华为昇腾NPU两个平台上均验证了专家并行方案。这也是DeepSeek官方第一次在正式文档中把华为昇腾和英伟达并列写进硬件验证清单。
经深度优化后,DeepSeek-V4在华为昇腾芯片上的推理速度较初期版本提升35 倍,华为CANN框架与英伟达CUDA框架的代码兼容性已逼近95%,这意味着,国产大模型迈向“去英伟达化”的关键一步。
DeepSeek也在文档中表示,预计下半年昇腾950超节点批量上市并部署之后,V4-Pro版本的价格还会大幅度下调。
寒武纪也宣布,基于自研软件生态与框架,完成DeepSeek-V4适配,适配代码同步开源。
DeepSeek新模型API调用价格。
当前,“国模+国芯“已成为国内大模型的趋势。
4月23日,壁仞科技发文称,壁仞科技基于主流开源框架,已经实现针对腾讯混元Hy3 preview模型的适配及推理验证。早先时候,智谱开源图像生成模型GLM-Image,成为首个在国产芯片上完成全程训练的SOTA(最优模型)多模态模型。
而国产芯片训练大模型在上海早有实践,阶跃星辰、华为昇腾、壁仞科技、无问芯穹、沐曦股份等,组建“模芯生态创新联盟”,抱团解决AI算力“卡脖子”问题。
山西证券指出,DeepSeek-V4等国产大模型有望原生适配国产算力,供需两旺下,国产芯片对国产通信芯片解决方案的需求更为迫切。随着更多国产芯片登陆资本市场,国产算力芯片的供给能力正大幅增强。
首轮融资仍存变数
就在DeepSeek-V4发布前,有市场消息称,阿里巴巴和腾讯正在与DeepSeek展开融资洽谈,估值从去年的100亿美元上调至200亿美元。
DeepSeek虽然尚未公开回应此事,但记者从一些行业内部人士获悉,融资洽谈仍处于初步阶段,最终估值存在变数。
一旦敲定,这将是DeepSeek成立以来的首次融资,也将打破梁文锋长期坚持“不引入外部资金”的铁律。
MiniMax、智谱等“AI小龙”们积极拥抱资本市场,其中智谱的总市值超过4300亿港元,MiniMax市值也逼近3000亿港元。
相比之下,DeepSeek像是国内AI的“异类”,更像是一个AI实验室,而非盈利性的商业公司,既没有互联网大厂背景,也没有披露可观的营收。
技术开源、免费使用等特性,致使DeepSeek面临较大的资金压力,也遭受了前所未有的人才流失。
据不完全统计,近一年以来,DeepSeek至少有5名核心研发成员确认离职,包括DeepSeek-V3核心技术专家罗福莉跳槽至小米,DeepSeek-R1核心研究员郭达雅入职字节跳动等。
在技术高速迭代、人才加速流失,资金大量投入的当下,DeepSeek急需一场胜利。
在官方公告的文末,DeepSeek引用了《荀子》的一句话:不诱于誉,不恐于诽,率道而行,端然正己。
不为赞誉所诱惑,不因诽谤而恐惧,遵循正道行事,端正自身品格。这或许就是DeepSeek-V4给市场的答案。
原标题:《摆脱英伟达依赖,DeepSeek新模型适配华为芯片,与美国顶尖模型有差距》
栏目主编:李晔
本文作者:解放日报 查睿
题图来源:新华社
热门跟贴