春节刚过,科技圈又开始集体高潮了。DeepSeek-V4要在2月中旬发布的消息传得满天飞,什么"碾压Claude""成本只要1美元""国产芯片终于能打了",听得我一愣一愣的。作为一个习惯先查证再激动的人,我花了两天时间翻遍论文、财报和官方回应,发现这瓜吃起来,味道不太对。

打开网易新闻 查看精彩图片

先说最离谱的

2月11号那天,DeepSeek的App突然更新,上下文从12万字暴涨到100万字,网上立马炸锅,说是V4提前偷跑。我赶紧去扒官方说法,结果人家明确回应:这是V3系列的"终极灰度版",不是V4。好家伙,一群人对着V3的升级版喊"颠覆",这误会闹得,堪比把改款当换代。

更逗的是用户反馈

不少尝鲜的人发现,新版AI突然"性情大变"——不再一口一个"亲",回答也公事公办,没了人情味。业内人士私下聊,说这是为了提速不得不做的"阉割":算力就那么点,想要快就得砍掉情绪价值。你看,所谓的"极致性价比",说白了就是精打细算过日子,哪有什么魔法。

V4本身的技术底子还是有的

我扒到两篇刚发的论文,一个是mHC技术,专门解决模型层数做深了容易"脑抽筋"的问题;另一个是Engram,思路挺巧,把"死记硬背"和"动脑思考"拆开,常识直接查表,难题再慢慢算。这招就像学生考试,基础题翻书,大题才动脑子,确实能省不少算力

打开网易新闻 查看精彩图片

野村证券的报告我也看了

说V4不会引发去年V3那种算力恐慌,因为它主打"省钱"而不是"堆卡"。这话在理。通过算法优化降低成本,让中小企业用得起,比单纯刷榜更有意义。报告还提到这能缓解国产芯片的瓶颈——用聪明的算法弥补硬件差距,确实是条务实路子。

但问题来了

原文里那些"成本仅为Claude的1/68""算力利用率85%"的数字,我翻遍野村证券的原文也没找到,大概率是营销号自己加的戏。还有那个"NSA原生稀疏注意力",我在arxiv和技术文档里搜了个底朝天,根本查无此技术,疑似生造名词。技术报道最怕这种"九真一假",把靠谱的创新包装成科幻小说,反而砸了招牌。

至于编程能力超越Claude的说法

目前只有"内部测试"和"知情人士"的传闻,没有第三方独立验证。Claude在代码圈的口碑确实硬,但DeepSeek-V3的表现已经不差,V4再进一步也不是没可能。只是"超越"这种词,得等正式发布后让开发者真金白银地投票,现在喊出来,更像是给自己壮胆。

说到底,V4最值得关注的不是参数又涨了多少,而是它能不能把AI从"实验室的宝贝"变成"菜市场的大白菜"——便宜、皮实、随叫随到。如果真能用算法创新把成本打下来,让国产芯片也能跑出好效果,那才是对中国AI产业实实在在的贡献。

打开网易新闻 查看精彩图片

技术迭代值得鼓掌,但还没见影就先喊"颠覆",这种风气真的该改改了。等2月中旬真发布了,拉出来跑个分、写段代码、算算账,是骡子是马一目了然。现在嘛,让子弹再飞一会儿,咱别急着下跪。