刚被GPT5.5刷屏几小时,国产大模型就扔出王炸?

近日,DeepSeek憋了15个月的大更新终于来了,DeepSeek-V4系列正式上线,还同步开源!海外网友直接炸锅,评论区满屏“鲸鱼回来了”“便宜又强大”,连OpenAI的热度都被分走不少。

这次更新不仅是模型迭代,更是给整个行业扔下了一颗“价格+性能”的双响炮。

这意味着你可以直接扔进去一本小说、一份超长合同,模型都能完整理解。

打开网易新闻 查看精彩图片

参数方面,Pro是1.6万亿总参数,Flash是2840亿总参数,预训练数据都超过32万亿。

价格更是延续了DeepSeek的“卷王”风格:Pro每百万tokens输入1元、输出12元;Flash输入0.2元、输出2元。网友直接感慨:“还是那个DeepSeek,太普惠了!”

这次更新最受关注的,是DeepSeek终于用上了国产算力!官方小字透露,V4系列和华为昇腾合作,但受限于高端算力,Pro版本的服务吞吐目前很有限。

不过别急,下半年昇腾950超节点批量上市后,Pro的价格还会大幅下调。这波操作不仅打破了国外算力垄断的焦虑,更让国产大模型的未来多了几分底气。

DeepSeek-V4的性能到底有多强?官方给出的评测数据相当能打:

Pro版本:Agent能力直接干到开源模型天花板,内部员工用它写代码的体验比Anthropic的Sonnet 4.5还好,交付质量接近Opus 4.6非思考模式。

世界知识测评大幅领先其他开源模型,仅略逊于Gemini-Pro-3.1;数学、STEM、竞赛代码方面,超越所有公开开源模型,比肩顶级闭源。

Flash版本:虽然世界知识稍弱,但推理能力接近Pro,而且更快更便宜。简单任务和Pro旗鼓相当,高难度任务略有差距,适合日常快速使用。

更牛的是,Pro-Max模式在标准推理基准上,竟然优于GPT5.2和Gemini3.0-Pro,只比GPT5.4和Gemini3.1-Pro差一点。这在开源模型里,绝对是断层领先的存在。

就在说-to-AGI的目标不断靠近”。技术突破与遗憾,未来还要补哪些课?

打开网易新闻 查看精彩图片

未来DeepSeek计划精简架构、研究训练稳定性理论、探索更稀疏的嵌入技术,还要加入多模态能力。

不过这次V4没发布多模态版本,有猜测是算力和资金不足。毕竟多模态已是行业标配,DeepSeek至今没切入,融资确实迫在眉睫。

评论区聊聊你的看法,觉得有用的话别忘了点赞收藏,让更多人知道这个国产卷王