其他公司每周干80小时，但不加班的DeepSeek,是靠什么创造神话的

墨兰史书

2026-05-06 18:15 ·河南 ·网易号优质内容创作者

2026年4月24日，DeepSeek把新一代V4推上台面。外面一边喊“终于来了”，一边盯着它憋了15个月的沉默。

同一时间，行业里到处在比拼每周70到80小时的“硬扛”，DeepSeek却被贴上“不打卡、六七点下班”的标签。不加班的研究团队，真能跑赢拼命三郎吗？神秘的沉默，是在蓄力，还是在承压？

大模型这行的日常，很多人早就熟了。会议一场接一场，迭代按周计算，指标像闹钟一样催命，深夜灯光成了“努力”的装饰。

头部公司抢人更直接，核心算法、训练、推理、工程架构，能打仗的那批人，几乎都被放进“重点争夺清单”。

在这种氛围里，DeepSeek的节奏显得反常。很多团队把“熬”当成捷径，它却更像在做时间预算，把一天的高质量工作切得很硬。

梁文峰的逻辑也很“理工”。他把人的有效专注当成上限，把疲劳状态下的决策当成风险，认为那会反过来浪费算力。

这句话听上去像管理学鸡汤，放在大模型训练里就变得很现实。训练一次就要烧掉大量资源，糟糕的判断可能让一堆卡白跑。

DeepSeek把“少熬夜”当成制度，不是为了躺平，更像把算力当成国之重器那样精打细算，宁愿慢一点，也要把每一步踩实。

慢就意味着等待。R1当年震动行业后，外界盯着它下一步，心态很快分裂成两派：一派等“王者归来”，一派觉得“神话要散”。

最抓人的不是慢，而是静。团队从上到下长期低调，发布节奏像深海一样，外界越喧闹，它越像没听见。

这种安静并非没有代价。时间越长，围绕它的想象越多，想象越多，落地时的落差就越容易被放大。

更现实的冲击来自人。大模型不是流水线，真正决定上限的，往往是少数人的方法论和手感，核心作者的流动会直接改写团队的“内功”。

过去一段时间里，DeepSeek陆续出现关键成员离开：有人去了小米，有人被腾讯吸走，有人转去字节，还有从早期一路跟着创业的人，去了自动驾驶创业公司。

这些去向不奇怪。巨头在这一轮里展现的能力不止是钱，还有平台、数据、产品入口、算力储备、融资叙事，组合起来像一张更大的网。

猎头圈的报价更像加速器。翻两三倍的薪资只是起步，有的直接给到八位数总包，放在任何行业都足够让人认真重新计算人生。

DeepSeek并不穷，问题在于它曾经不靠融资，也就缺少一个人人看得懂的“标尺”。

期权这件事，在没有清晰估值时很尴尬。员工手里拿着纸面承诺，却没法像上市公司那样随时对照价格，心里难免打鼓。

更刺眼的是对比。别的公司资本故事走得快，MiniMax、智谱等被市场高度关注，财富兑现的速度更快，账面数字很容易变成真实身家。

当对比出现，选择就变得像多选题：继续在实验室里磨长期问题，还是去更快兑现回报的地方。很多人不是不热爱研究，只是扛不住现实。

在这种压力下，梁文峰开始接受融资的可能性。外界报道里出现过一个很醒目的数字：3000亿元估值。

估值高不高是一回事，更关键的是它意味着公司愿意把自己放进更透明的市场坐标里，让“期权值多少”不再靠想象。

人才之外，还有一种更隐蔽的压力，叫预期错位。

很多人希望DeepSeek每次出手都像R1那样“炸场”，模型一发就改写舆论，顺带把同行逼到墙角。

这种期待很爽，技术规律却不配合。大模型演进更像攀岩，真正的难点常常是稳定性、数据治理、后训练策略、推理效率，属于慢工活。

DeepSeek对自己的“使命感”也更硬核。它不仅追求智能上限，还把两件事放进核心任务里。

一件是适配国产芯片跑大模型。V4发布后，华为昇腾很快同步支持，意味着它从架构到工程都在为国产算力生态预留空间。

另一件是更强调原创式探索。它愿意去做一些大厂不愿意碰、创业公司不敢碰的长期方向，像在研究树上种“慢结果”。

这两件事放在一起，解释了它为什么不急着追热点。外界想看“爆款”，它更像在搭“底座”，把中国自己的技术路线走稳。

也正因为路线不同，组织形态也不同。DeepSeek的内部不像典型互联网公司那样层层管理，更像一个大型实验室。

据接近团队的人描述，研究团队规模过百，层级却极少，基本只有梁文峰和研究员两层。

没有“二把手”的强势中转，意味着信息更直达，决策更像学术讨论而非KPI博弈，代价是对创始人的组织能力要求极高。

更少的层级也带来更大的自由度。研究员可以自由组队，也能一个人啃长期问题，节奏像做课题，不像赶项目。

外界常见的打卡、硬绩效、强deadline，在这里存在感很弱。它不靠“吼出来的速度”，更靠“磨出来的质量”。

梁文峰在团队里的角色，也更像导师型负责人：一边协调资源，一边参与研究，成果署名方式更接近科研共同体的习惯。

这种气质也解释了他为什么显得神秘。见过他的人常提到，他不像传统意义的CEO，更像一个把注意力锁在技术细节上的研究员。

这些细节拼起来，会让人对“神话”两个字产生新的理解。DeepSeek的传奇不靠话术，更像靠一种反潮流的专注。

就连公益事件也带着同样的低调。2022年，幻方体系里曾出现过一位化名“一只平凡的小猪”的员工，以个人名义捐出1.38亿元。

外界猜测身份猜到沸腾，相关方回应的态度却很一致：捐款是匿名的，公司内部也未必知道是谁。

这件事的意义不在“是谁”，而在“这种文化”。能把巨额捐赠做得不张扬，说明团队更看重事情本身，不太迷恋曝光。

把这些线索连成一条时间线，就能看见DeepSeek的真实处境。

R1之后的15个月，它用沉默换取打磨空间，外界则用想象给它抬高舞台。

舞台越高，风越大，核心成员的流失就越刺眼，巨头的挖人像在最关键的骨架上拆螺丝。

它选择用融资来对冲不确定性，用更明确的价值尺度稳住军心，尽量把长期研究的“风险”变成可承受的成本。

它也用国产芯片适配来回答另一道大题：大模型不是一家公司自己的胜负，更是中国算力生态、工程能力、算法体系的整体进阶。

很多人把“不加班”当成故事的噱头，我更愿意把它当成一种资源观。

当行业都在用时间堆产出时，它把高质量时间当成稀缺品，把算力当成硬通货，把人当成需要保护的“长期资产”。

这种打法未必处处适用，却对中国科技很有价值。中国不缺勤奋，缺的是把勤奋用在刀刃上的组织能力，缺的是敢把短期热闹换成长期领先的耐心。

V4在2026年4月24日到来，意味着它选择继续走这条路。路上有被挖人的疼，有预期错位的噪音，也有组织形态带来的不确定。

其实DeepSeek究竟靠什么“创造神话”，答案反而更朴素：靠少而精的专注、靠对算力与人才的节制使用、靠把国产生态纳入主线任务。

大模型竞赛不是比谁熬得更久，而是比谁更能把有限的时间、人才、算力，变成中国自己的长期优势。

信息来源：
［1］科技连线｜DeepSeek V4上线，AI世界正在改变的规则澎湃新闻
［2］刚刚，直线猛拉！DeepSeek V4正式发布中国基金报

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴