打开网易新闻 查看精彩图片

4月24日注定被写入AI发展史。

凌晨OpenAI刚刚抛出GPT-5.5,上午DeepSeek V4预览版闪电上线,一闭一开、一美一中,在全球算力与模型的巅峰擂台上完成罕见“同框”。

DeepSeek V4携1.6万亿参数MoE架构、百万上下文、MIT开源协议登场,新模型发布叠加4月上旬创始人梁文锋内部沟通会确认公司启动外部融资,腾讯、阿里入局,深度求索估值直接冲上200亿美元关口。

一边是技术碾压式刷屏,一边是坚守多年“不融资”信条破防;一边是A股算力概念股全线暴涨,另一边是核心人才流失、研发延期的隐痛暗流涌动。DeepSeek V4的发布远比参数更值得细读。

V4-Pro在代码基准超越GPT-5.4与Gemini 3.1 Pro,数学推理紧贴第一梯队,知识与长文短板清晰可见;定价直接腰斩海外巨头,却悄悄上调自家前代价格,“价格屠夫”头衔有些名不副实;全面适配华为昇腾,被市场解读为国产算力“可用转好用”的里程碑,黄仁勋口中的“可怕结果”正在成真。

从R1登顶美区App Store到V4正面硬刚 GPT-5.5,DeepSeek只用15个月。但华丽数据背后,是梁文锋不得不面对的现实:万亿模型烧钱速度指数级上升,核心研究员接连被大厂挖走,期权缺乏估值锚点留不住人,从“小而美极客团队”走向商业化与组织扩张的阵痛全面爆发。

V4不是终点,而是一场技术登顶、资本转身、生态重构的三重变局,中国AI第一次以开源姿态,站到改写全球权力版图的位置。

代码与推理强势登顶,知识短板仍显差距

第三方评测在发布后数小时密集出炉,结论直白:意料之中的强,意料之外的快。

V4 系列双版本并行,Pro 以1.6万亿总参数、49B激活参数主打旗舰,Flash以284B总参数、13B激活参数走性价比路线,双双原生支持100万token上下文,彻底拉开与主流开源模型的代际差距。

代码能力成为最强杀手锏。在LiveCodeBench中V4-Pro-Max以93.5分超过 GPT-5.4 的 91.7与 Gemini 3.1 Pro 的 89.2,Codeforces 人类选手榜排名第 23,Vibe Code Bench拿下开源模型第一,较V3.2提升近10倍,被开发者称为“编程神器”。

用户实测显示,它可连续自主编程超 60 分钟,独立完成数据库设计与安卓模拟器开发,长程规划与自我纠错能力接近商用工程标准。

数学与STEM 同样亮眼,HMMT 2026 Feb 达到 95.2,与 Opus-4.6 Max、GPT-5.4 几乎持平,Apex Shortlist 90.2 分碾压同期所有模型。

短板同样毫不遮掩。在SimpleQA-Verified知识评测中,V4-Pro仅57.9分,远低于Gemini 3.1 Pro的75.6;高难度推理 HLE 37.7,与对手44.4存在近7个点差距。

DeepSeek官方坦然承认,综合能力距最前沿模型仍有3—6个月差距,知识与事实检索是最大短板,数学与 STEM 进展最快。这种清醒与克制,在漫天鼓吹中尤为难得。

稍让人诟病的是V4的定价策略,V4-Flash 每百万token约0.3 美元,Pro 约 3.5 美元,较 Claude Opus 4.7 低 99%,比 GPT-5.5 低近九成,国产模型整体比海外便宜约60%。

但 Pro 版本相对前代上调定价,被媒体吐槽“对不起价格屠夫称号”。

更关键的是,V4从训练到推理深度适配华为昇腾,脱离英伟达CUDA 生态,实测端到端延迟比 H100集群低35%,标志国产算力真正进入好用阶段,也让美国科技界感受到真实压力。

全球开发者社区呈现两极评价:中文圈盛赞其编程 Agent与低价普惠,美国社区认可架构创新,同时质疑训练芯片透明度与技术差距。

Replit CEO盛赞长上下文效率是“真正架构突破”,美国智库研究员则渲染“中国蒸馏恐慌”,争论本身已证明 DeepSeek 跻身全球第一阵营。

深度求索上探200亿估值

V4 发布的最大意外,不是参数与跑分,而是梁文锋打破坚持多年的不融资底线。

此前 DeepSeek 依托幻方量化自给自足,拒绝所有外部资本,如今首度开启股权融资,估值从100亿美元跳升至200亿美元,腾讯、阿里洽谈合计投资18亿美元,消息震动整个一级市场。

转身背后是残酷现实,万亿参数模型训练与推理成本呈指数级飙升,单一股东输血难以为继。

更致命的是人才流失,2025 年下半年至今,第一代模型核心作者王炳宣、V3 核心罗福莉、R1关键研究员郭达雅相继出走,加盟腾讯、小米、字节等大厂。核心原因直指期权缺乏市场化估值锚点,员工持股无法变现,面对大厂八位数总包毫无还手之力。

梁文锋内部沟通直言,融资核心目的之一就是建立估值体系,用可兑现期权稳住团队,补上组织短板。

研发节奏暴露扩张阵痛。V4 原定春节发布,一再延期至4月,背后是架构重构、算子重写、国产芯片适配三重压力,人才流失进一步拖慢进度。

曾经“不加班、不打卡、无 KPI”的极客文化,在万亿模型工程化面前难以为继,从小团队精英作战转向数百人协同攻坚,管理与流程短板集中爆发。

服务稳定性同样拉响警报,2026 年多次出现长时间宕机,最长一次近12 小时,在商业化关键节点严重挫伤用户信任。

资本市场已先行定价。4月24日A股 DeepSeek 概念股集体爆发,皖通科技、浙数文化瞬间封板,海光信息、润和软件大涨,港股中芯国际、华虹公司同步冲高。

逻辑高度一致,V4 证明国产芯片可支撑世界级大模型,从依赖英伟达转向自主可控闭环,算力国产替代进入正反馈,券商预计 2026 年国产算力芯片出货量翻倍增长。

但喧嚣之下风险清晰,开源商业化路径尚未跑通,API 价格战白热化,长期盈利模式不明;人才争夺白热化,组织稳定性仍是最大隐忧;从技术实验室走向商业公司,文化与效率的平衡考验尚未开始。

对此,梁文锋引用荀子“不诱于誉,不恐于诽”,恰是此刻最佳写照:登顶之后,理想主义必须学会在资本与组织的现实中落地。

一张“V4”画卷,描绘中国AI的破局之路

24小时足以改变全球 AI 格局。

DeepSeek V4以开源姿态正面迎战 GPT-5.5,代码登顶、推理比肩、百万上下文普及、国产算力跑通,完成从追赶并跑向局部领跑的跨越。

它证明中国团队能做出世界顶级模型,证明国产算力不再受制于人,证明开源可以成为对抗巨头封闭生态的硬核力量。

但V4从来不止是技术胜利。融资破防、人才流失、组织阵痛、定价矛盾,共同勾勒出一家顶级AI公司的成人礼:技术登顶只是上半场,资本运作、组织建设、商业闭环、生态治理才是决定终局的下半场。

梁文锋的妥协与转身,不是理想褪色,而是认清规律后的成熟。

全球AI权力版图正在重绘:封闭巨头与开源阵营二分天下,美国技术壁垒与中国自主可控并行演进,算力、模型、应用、资本四条赛道同时洗牌。

V4 给出的答案清晰而克制,承认3—6个月差距,不吹不擂;代码与推理强势突围,守住优势;拥抱资本与组织进化,补齐短板;坚持开源普惠,让整个行业受益。

中国AI不需要神话,只需要真实的进步。

DeepSeek V4 的意义,不在于参数多震撼、跑分多耀眼,而在于它用一场冷静而强悍的发布,告诉世界,中国有顶级技术、有国产算力、有极客精神,更有直面短板、踏实前行的定力。

这才是全球AI新格局里,最不容小觑的中国力量。

@以上内容版权归属「iNews新知科技 」所有,如需转载,请务必注明。