DeepSeek-V4上线近十日,外界对这款频频“跳票”的模型评价逐渐清晰:V4是一款性价比突出、补齐关键能力的务实产品,但并未重现当年R1的炸场表现。

其中,百万上下文、开源开放与低定价构成其核心亮点,上下文有效性、响应时延、稳定性则仍有明显提升空间。置身于全球AI赛道,DeepSeek模型排名回落、迭代周期明显拉长,叠加外部融资启动等多重信号,曾经的大模型创新“领跑者”俨然已退转到“追赶者”位置。

业内认为,对于DeepSeek这个“技术理想主义者”而言,这一轮“增速放缓”并非单纯的算法或产品问题,而是算力路线选择、工程适配节奏以及商业化压力多重作用的结果。

打开网易新闻 查看精彩图片

上线十日口碑画像:性价比在线,体验仍有短板

自4月24日上线以来,DeepSeek-V4市场评价几经反转,颇有些“冰火两重天”的意味。

从多方实测结果来看,V4在长文本与代码两大核心方向,确实交出了可落地的答卷。模型支持百万级上下文窗口,在文档处理、长篇代码库解析、报告总结等场景中具备明显优势,官方将这一能力开放普惠,有效降低了中小开发者与企业使用长上下文的门槛。

在代码生成方面,V4对常规前端实现、算法脚本、简单工具类程序的完成度较高。如2048小游戏、树形生长动画、康威生命游戏等任务,均可稳定输出可直接运行的代码,在有明确规划与任务拆解的条件下,足以胜任较为复杂的Web应用实现。

更重要的是,DeepSeek保持了一贯的低成本优势,实测多任务连续调用成本显著低于头部闭源模型,轻量化版本进一步降低了使用门槛,对预算敏感的团队与批量推理场景非常友好。加之模型同步开源,支持私有化部署与二次微调,在产业落地层面具备很强的现实价值。

与此同时,V4的体验短板也同样突出。在百万字级别的长文本“大海捞针”测试中,模型对中间区域信息的召回率明显下降,容易出现计数错误、位置误判、关键信息遗漏等问题,真实有效上下文与理论上限存在差距,长距离“失忆”现象依然存在。

此外,该模型对复杂工程化任务的响应速度偏慢,高难度前端实现耗时较长,在实时性要求高的场景中体验受限。模型整体稳定性与一致性也仍有提升空间,如简单任务偶发逻辑错误,复杂需求多次迭代修复后仍难以完全达标,与全球顶尖闭源模型存在明显差距。

整体而言,V4无疑是一款目标清晰、取舍明确的产品:性价比与普惠能力极为突出,性能体验则远未触及天花板。这种定位收获了相对稳定的市场评价,但也让DeepSeek失去了曾经的先锋色彩。

从领跑者到追赶者,DeepSeek脚步放缓多重承压

过去一年多时间里,曾经以快速迭代、高效研发、低成本跑出惊人成果的DeepSeek,明显放缓了迭代节奏。这在全球AI大模型狂飙猛进中显得分外扎眼。

自去年初R1模型横空出世,DeepSeek貌似一直困在迟到的路上:年中的R2模型被爆因芯片问题一再延期,V4旗舰模型更是缺席今年春节档,跳票近半年时间。而在此期间,OpenAI和Anthropic在海外迅速进入月更节奏,国产大模型智谱、Kimi也开始加速反超。

据业内统计,在V4模型迟到5个多月以来,OpenAI的GPT-5历经四次迭代到了5.4版本,Anthropic的Claude 4.5系列迭代到4.7版本,谷歌的Gemini 3 Pro已更新至3.1版本。

这种迭代速率反差直接呈现在性能榜单上。在公开基准测试与社区盲测中,DeepSeek系列模型的综合排名由第一梯队跌落到中游区间,代码、推理、Agent能力等核心指标不再具备绝对优势,从行业“领跑者”逐步转变为“追赶者”。

显然,姗姗来迟的V4模型,并未一举扭转颓势。近期,深度求索打破此前坚持不融资的表态,启动了外部募资。业内认为,这一变化背后是大模型研发持续升级的算力投入、人才成本与工程化开支,高强度的“烧钱”模式下,公司自有资金已难以支撑长期军备竞赛。

从行业视角看,在这场全球化AI竞速中,DeepSeek所经历的并非个例,而是当前大模型行业从技术创新转向规模化竞争的普遍挑战。但对DeepSeek而言,这些压力被进一步放大,核心原因是算力路线选择带来的持续性约束。

有行业媒体分析,在国内厂商普遍采用更灵活的算力组合策略以保证迭代速度时,DeepSeek深度绑定昇腾,将大量资源投入框架迁移、算子补齐、分布式稳定性优化等工程工作,这不可避免地拉长了训练与验证周期,导致模型发布节奏被动调整,间接加剧了公司内外部压力。

算力底座掣肘,技术路线选择决定长期走向

大模型迭代的本质是数据、算法、算力三者的高效共振。在算法与数据差距逐步收窄的当下,算力的稳定性、效率、生态成熟度,直接决定研发周期、试错次数与上线节奏。

2025年以来,DeepSeek全面转向国产算力平台,并与华为昇腾深度绑定。随后,R2模型因昇腾适配问题直接夭折,研发周期也开始逐渐拉长。而从公开信息与技术文档可以看到,此次DeepSeek-V4并非在昇腾平台上完成训练,双方或仅实现推理侧适配。

根据专业人士判断,在DeepSeek模型研发迭代过程中,昇腾计算平台仍存在三大短板:

第一,训练稳定性与效率不足。早期昇腾910C在大规模分布式训练中故障率偏高,互联带宽与通信延迟相较成熟方案存在差距,大规模MoE模型训练效率大打折扣。即便升级到950系列,集群调度、通信优化、异常恢复等工程化能力也仍需完善,难以支撑高频次、高强度的模型试错。

第二,软件生态迁移成本极高。DeepSeek此前长期基于CUDA生态开发,转向昇腾CANN框架后,大量算子、优化逻辑、训练脚本需要重写,调试周期拉长,问题定位难度提升。工程团队被迫将大量精力投入生态适配,而非算法创新与模型迭代,间接拖慢了整体进度。

第三,硬件代际与供给节奏错配。模型研发有明确的时间窗口,但昇腾加速卡此前经历了从NPU到GPGPU的路线纠偏,芯片量产节奏、集群交付周期与模型迭代计划愈发难以同步,导致DeepSeek多次出现“等芯片、等适配、等优化”的情况,发布时间一延再延。

上述人士认为,当前,DeepSeek短期要做的是稳定体验、提升效率、加快迭代,通过V4的持续优化修复口碑。中长期必须解决的核心命题,则是算力引擎的系统性优化—— 在训练效率、生态适配、集群调度、硬件组合上做出更务实的选择,平衡自主可控与工程交付效率。

毋庸置疑,在这场大模型技术创新长跑中,底层技术路线的选择将决定后续长期走向。V4的性价比突围,给DeepSeek赢得了喘息时间,但不足以扭转算力和模型迭代失速的颓势。未来1-2年,能否重构计算引擎、提升迭代效率、稳定产品体验,将决定其能否重回第一梯队。