2026年4月24日,DeepSeek把新一代V4推上台面。外面一边喊“终于来了”,一边盯着它憋了15个月的沉默。

同一时间,行业里到处在比拼每周70到80小时的“硬扛”,DeepSeek却被贴上“不打卡、六七点下班”的标签。不加班的研究团队,真能跑赢拼命三郎吗?神秘的沉默,是在蓄力,还是在承压?

打开网易新闻 查看精彩图片

大模型这行的日常,很多人早就熟了。会议一场接一场,迭代按周计算,指标像闹钟一样催命,深夜灯光成了“努力”的装饰。

头部公司抢人更直接,核心算法、训练、推理、工程架构,能打仗的那批人,几乎都被放进“重点争夺清单”。

在这种氛围里,DeepSeek的节奏显得反常。很多团队把“熬”当成捷径,它却更像在做时间预算,把一天的高质量工作切得很硬。

打开网易新闻 查看精彩图片

梁文峰的逻辑也很“理工”。他把人的有效专注当成上限,把疲劳状态下的决策当成风险,认为那会反过来浪费算力

这句话听上去像管理学鸡汤,放在大模型训练里就变得很现实。训练一次就要烧掉大量资源,糟糕的判断可能让一堆卡白跑。

打开网易新闻 查看精彩图片

DeepSeek把“少熬夜”当成制度,不是为了躺平,更像把算力当成国之重器那样精打细算,宁愿慢一点,也要把每一步踩实。

慢就意味着等待。R1当年震动行业后,外界盯着它下一步,心态很快分裂成两派:一派等“王者归来”,一派觉得“神话要散”

最抓人的不是慢,而是静。团队从上到下长期低调,发布节奏像深海一样,外界越喧闹,它越像没听见。

打开网易新闻 查看精彩图片

这种安静并非没有代价。时间越长,围绕它的想象越多,想象越多,落地时的落差就越容易被放大。

更现实的冲击来自人。大模型不是流水线,真正决定上限的,往往是少数人的方法论和手感,核心作者的流动会直接改写团队的“内功”。

打开网易新闻 查看精彩图片

过去一段时间里,DeepSeek陆续出现关键成员离开:有人去了小米,有人被腾讯吸走,有人转去字节,还有从早期一路跟着创业的人,去了自动驾驶创业公司

这些去向不奇怪。巨头在这一轮里展现的能力不止是钱,还有平台、数据、产品入口、算力储备、融资叙事,组合起来像一张更大的网。

猎头圈的报价更像加速器。翻两三倍的薪资只是起步,有的直接给到八位数总包,放在任何行业都足够让人认真重新计算人生。

打开网易新闻 查看精彩图片

DeepSeek并不穷,问题在于它曾经不靠融资,也就缺少一个人人看得懂的“标尺”。

期权这件事,在没有清晰估值时很尴尬。员工手里拿着纸面承诺,却没法像上市公司那样随时对照价格,心里难免打鼓。

打开网易新闻 查看精彩图片

更刺眼的是对比。别的公司资本故事走得快,MiniMax、智谱等被市场高度关注,财富兑现的速度更快,账面数字很容易变成真实身家。

当对比出现,选择就变得像多选题:继续在实验室里磨长期问题,还是去更快兑现回报的地方。很多人不是不热爱研究,只是扛不住现实。

在这种压力下,梁文峰开始接受融资的可能性。外界报道里出现过一个很醒目的数字:3000亿元估值。

打开网易新闻 查看精彩图片

估值高不高是一回事,更关键的是它意味着公司愿意把自己放进更透明的市场坐标里,让“期权值多少”不再靠想象。

人才之外,还有一种更隐蔽的压力,叫预期错位。

很多人希望DeepSeek每次出手都像R1那样“炸场”,模型一发就改写舆论,顺带把同行逼到墙角。

打开网易新闻 查看精彩图片

这种期待很爽,技术规律却不配合。大模型演进更像攀岩,真正的难点常常是稳定性、数据治理、后训练策略、推理效率,属于慢工活

DeepSeek对自己的“使命感”也更硬核。它不仅追求智能上限,还把两件事放进核心任务里。

一件是适配国产芯片跑大模型。V4发布后,华为昇腾很快同步支持,意味着它从架构到工程都在为国产算力生态预留空间。

打开网易新闻 查看精彩图片

另一件是更强调原创式探索。它愿意去做一些大厂不愿意碰、创业公司不敢碰的长期方向,像在研究树上种“慢结果”

这两件事放在一起,解释了它为什么不急着追热点。外界想看“爆款”,它更像在搭“底座”,把中国自己的技术路线走稳。

打开网易新闻 查看精彩图片

也正因为路线不同,组织形态也不同。DeepSeek的内部不像典型互联网公司那样层层管理,更像一个大型实验室。

据接近团队的人描述,研究团队规模过百,层级却极少,基本只有梁文峰和研究员两层。

没有“二把手”的强势中转,意味着信息更直达,决策更像学术讨论而非KPI博弈,代价是对创始人的组织能力要求极高。

打开网易新闻 查看精彩图片

更少的层级也带来更大的自由度。研究员可以自由组队,也能一个人啃长期问题,节奏像做课题,不像赶项目。

外界常见的打卡、硬绩效、强deadline,在这里存在感很弱。它不靠“吼出来的速度”,更靠“磨出来的质量”。

打开网易新闻 查看精彩图片

梁文峰在团队里的角色,也更像导师型负责人:一边协调资源,一边参与研究,成果署名方式更接近科研共同体的习惯

这种气质也解释了他为什么显得神秘。见过他的人常提到,他不像传统意义的CEO,更像一个把注意力锁在技术细节上的研究员。

这些细节拼起来,会让人对“神话”两个字产生新的理解。DeepSeek的传奇不靠话术,更像靠一种反潮流的专注。

打开网易新闻 查看精彩图片

就连公益事件也带着同样的低调。2022年,幻方体系里曾出现过一位化名“一只平凡的小猪”的员工,以个人名义捐出1.38亿元。

外界猜测身份猜到沸腾,相关方回应的态度却很一致:捐款是匿名的,公司内部也未必知道是谁

打开网易新闻 查看精彩图片

这件事的意义不在“是谁”,而在“这种文化”。能把巨额捐赠做得不张扬,说明团队更看重事情本身,不太迷恋曝光。

把这些线索连成一条时间线,就能看见DeepSeek的真实处境。

R1之后的15个月,它用沉默换取打磨空间,外界则用想象给它抬高舞台

舞台越高,风越大,核心成员的流失就越刺眼,巨头的挖人像在最关键的骨架上拆螺丝。

打开网易新闻 查看精彩图片

它选择用融资来对冲不确定性,用更明确的价值尺度稳住军心,尽量把长期研究的“风险”变成可承受的成本。

它也用国产芯片适配来回答另一道大题:大模型不是一家公司自己的胜负,更是中国算力生态、工程能力、算法体系的整体进阶

打开网易新闻 查看精彩图片

很多人把“不加班”当成故事的噱头,我更愿意把它当成一种资源观。

当行业都在用时间堆产出时,它把高质量时间当成稀缺品,把算力当成硬通货,把人当成需要保护的“长期资产”。

这种打法未必处处适用,却对中国科技很有价值。中国不缺勤奋,缺的是把勤奋用在刀刃上的组织能力,缺的是敢把短期热闹换成长期领先的耐心。

打开网易新闻 查看精彩图片

V4在2026年4月24日到来,意味着它选择继续走这条路。路上有被挖人的疼,有预期错位的噪音,也有组织形态带来的不确定

其实DeepSeek究竟靠什么“创造神话”,答案反而更朴素:靠少而精的专注、靠对算力与人才的节制使用、靠把国产生态纳入主线任务。

打开网易新闻 查看精彩图片

大模型竞赛不是比谁熬得更久,而是比谁更能把有限的时间、人才、算力,变成中国自己的长期优势。

信息来源:
[1]科技连线|DeepSeek V4上线,AI世界正在改变的规则 澎湃新闻
[2]刚刚,直线猛拉!DeepSeek V4正式发布 中国基金报

打开网易新闻 查看精彩图片