打开网易新闻 查看精彩图片

本报(chinatimes.net.cn)记者石飞月 北京报道

时隔一年多,DeepSeek终于迎来重大更新。4月24日上午,DeepSeek官方宣布V4预览版正式上线并同步开源,且透露了与华为昇腾的合作。不知是巧合还是有意为之,当日凌晨,OpenAI突然发布了GPT-5.5,以及更高规格的GPT-5.5 Pro。

DeepSeek最近一直深陷“舆论”中,因为其“不差钱、不融资”的高冷人设被一则传闻打破:阿里、腾讯正在洽谈投资。这是创始人梁文锋首次被传松口。在业内人士看来,背靠幻方量化却突然拥抱外部资本,缺的绝不是银子,而是能稳住人心的筹码。

多名核心人员被传跳槽,梁文锋这个AGI理想主义者或许正在调整步伐。开源与免费的蓝图再辽阔,终究要面对人才这道有重量的现实,此时的融资传闻,更像是为DeepSeek长远之路系上的安全带。

与华为合作

此前就有传闻称,DeepSeek这次将实现与华为昇腾等国产芯片的深度适配,标志着中国AI产业在“去CUDA化”道路上迈出关键一步。据媒体报道,英伟达创始人兼CEO黄仁勋近期还在接受采访时表示,如果DeepSeek这类优秀的开源模型专门针对华为等本土硬件进行深度优化且运行效果最佳,客观上将直接削弱美国技术栈的全球优势。

DeepSeek官方并未在新模型上线的官宣文案中明说,只是在API价格表下标注:受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。但华为计算方面表示,昇腾一直同步支持DeepSeek系列模型,本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek V4系列模型。

顺福资本创始人李明顺就此对《华夏时报》记者表示,如果单纯基于英伟达的卡堆参数,V4可能早就出来了,但DeepSeek这家公司的独特之处就在于,它的逻辑不是靠融资、烧钱、堆算力的传统商业路数,它的追求可能更大——如果能在国产芯片生态上跑出一个世界级的、性能卓越的V4版本,那将是对大模型底层算力平权的又一次颠覆性贡献。

此次DeepSeek-V4模型按大小共分为两个版本:deepseek-v4-pro和deepseek-v4-flash,其中,deepseek-v4-pro为专家模式,deepseek-v4-flash为快速模式。

在上下文方面,V4达到了百万字级别,DeepSeek也表示,从现在开始,1M(一百万)上下文将是DeepSeek所有官方服务的标配;Agent能力方面,DeepSeek称,在Agentic Coding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异;世界知识方面,DeepSeek表示V4-Pro在测评中大幅领先其他开源模型,仅稍逊于顶尖闭源模型Gemini-Pro-3.1;推理性能方面,该公司称在数学、STEM、竞赛型代码的测评中,V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。

价格方面,尽管DeepSeek表示后续还会进行下调,但相比刚刚发布的GPT-5.5来说要便宜很多。

在上下文为1M的前提下,V4-Pro输入(缓存命中)和输入(缓存未命中)的价格分别为1元和12元,输出价格为24元,V4-Flash输入(缓存命中)和输入(缓存未命中)的价格分别为0.2元和1元,输出价格为2元;而GPT-5.5的输入价格为5美元/百万tokens、缓存输入0.5美元/百万tokens、输出30美元/百万tokens,直接在GPT-5.4的基础上翻了一番。

护城河告急

除了新模型上线,DeepSeek近期其实一直在舆论中心——外部融资。其实去年春节期间出圈以来,DeepSeek最为人津津乐道的一个信息点就是从来没接受过外部融资,这一点与和该公司同期成长起来的“AI六小虎”完全不同。

这是因为DeepSeek背靠同样由梁文锋创立的幻方量化这家依靠数学与人工智能进行量化投资的对冲基金公司,在量化私募圈,素有“北九坤,南幻方”“四大天王”的说法,幻方量化经过多年成长,已经成为私募基金行业的巨头,也就是说,DeepSeek背后的梁文锋和幻方量化,本身就是极具实力的资本。

天眼查工商数据显示,DeepSeek的股东包括持股99%的宁波程恩企业管理咨询合伙企业(有限合伙)和持股1%的梁文锋,宁波程恩企业管理咨询合伙企业(有限合伙)也由梁文锋直接和间接持股。

《华夏时报》记者就融资传闻分别采访了DeepSeek、阿里巴巴和腾讯方面,截至发稿未收到确认回复。截至发稿,天眼查上有关DeepSeek的工商信息中,融资这一栏依然只有2023年8月2日出资设立的内容。

在业内人士看来,如果DeepSeek正在寻求外部融资的消息属实,那么梁文锋为的肯定不是资金。“DeepSeek确实已经到了必须融资的关键时间节点,这背后主要有两个核心驱动逻辑。”李明顺分析道,DeepSeek近期经常出现宕机现象,这直观地反映出用户量和调用量的规模,背后是对算力需求的指数级增长,卡资源和算力储备需要补充,融资能与那些手握大量算力资源的平台公司合作。

而更重要的驱动逻辑,李明顺指出是为留住人才。“大模型领域的核心人才极其稀缺,对于这些顶尖人才,仅靠工资是留不住人的,必须要有股权的‘金手铐’。现在外部环境很严峻,像小米、字节等大厂都在高薪挖DeepSeek的核心骨干,这对梁文锋来说是一个现实的威胁。”

对于矢志实现AGI的DeepSeek而言,人才是极其重要的资产。众所周知,V3模型的重要贡献者罗福莉已经去了小米,近期有消息称,DeepSeek的核心研究员郭达雅也已经跳槽字节跳动,另外还有代码研究、大模型核心开发的关键人物陆续出走。

文渊智库创始人王超进一步分析道,小米是上市公司,字节跳动虽未上市,但内部股权有活跃的流通机制和回购价格,这意味着它们发给员工的期权或限制性股票不是一张空头支票,而是可以参照、可以变现、可以被丈量的资产。“这正是DeepSeek当下的结构性困境,梁文锋应该也给员工分配了股权,但这些股权既没有在一级市场流通过,更没有二级市场的锚定价格,没有交易,就没有价格,没有价格,就没有说服力。”

王超用一句话概括本质:DeepSeek招募的这群人不缺下家,市场会自动为他们出价,而价高者得,是再朴素不过的规则。

争抢入场券

融资势必会涉及到估值,据报道,DeepSeek的目标估值已从几天前的至少100亿美元上调至逾200亿美元(约合人民币1367亿元)。

这个估值对于一家成立不久且未上市的创业公司来说已经很高,但在李明顺看来,这个水平还够不到DeepSeek的真正价值。“首次融资,我认为300亿美元左右的估值才是更公允、更合理的水平。别说是200亿美元,就算在更高一些的区间,对于投资人来说依然是极具吸引力的底部介入机会。”

王超也向本报记者指出,即便是200亿美元这个数字,放在整个AI赛道的坐标系里,依然算不上高,只是一个偏保守的水平。“在C端用户规模上,DeepSeek要高过已经上市的智谱和MiniMax。”根据4月23日收盘的数据,智谱目前的市值已经达到4583亿港元(合人民币3999亿元),MiniMax为2693亿港元(合人民币2350亿元)。

与智谱和MiniMax相比,商业化是DeepSeek的短板,但在全球知名度、行业影响力和后续爆发潜能上,这家公司依然处于国内大模型的前列。据AI产品榜公布的3月数据,国内总榜中,DeepSeek仍然以1.37亿月活排在第三,排在第一和第二的分别为豆包(3.31亿)和千问(2.23亿);国外总榜中,DeepSeek继续以绝对优势领跑,Dola(豆包海外版)以7311万的月活紧随其后。

要知道,DeepSeek在过去一年多的时间里(去年春节走红后),一直没有进行过大版本的更新,市场一开始期待R2上线,之后又期待V4到来,但到现在为止,其版本依然是去年12月更新的V3.2。此外,不同于大厂砸重金宣传的路子,DeepSeek几乎没有做过广告,目前的规模基本靠“自来水”。

这可能也是网传投资方花落阿里巴巴和腾讯这两家大厂的原因之一,尽管这两家都有自己的大模型产品。除了市场表现,DeepSeek还以完全开源的模型权重和技术报告,打破了头部厂商对顶尖大模型的闭源垄断,催生了繁荣的社区微调生态与私有化部署浪潮,倒逼OpenAI、Google等巨头不得不重新考虑闭源策略的价值。

“腾讯自身在基础模型层面相对短缺,且旗下的元宝是国内大厂中力挺DeepSeek生态最积极的,所以腾讯一定会是最主动的战略投资者。而阿里是‘All in AI’的策略,属于绝不放过任何一个关键赛点,加上阿里云是国内卡资源最丰富的云厂商之一,如果阿里入局,DeepSeek缺卡的问题能直接通过资源协同得到缓解。”李明顺说。

王超也认为,腾讯的意愿可能比阿里更加强烈。“元宝从一开始就深度借势DeepSeek,其C端用户量的暴增与接入DeepSeek有直接的因果关系。腾讯已经切身体验到了DeepSeek模型的力量,它不需要再被说服。DeepSeek在第一梯队,现在可能愿意开放投资窗口,对于腾讯而言,这是一个不需要犹豫的选择。它已经靠DeepSeek挣到了用户,接下来它要挣的,是更深度的绑定。”

去年12月24日,腾讯元宝官微发布的《元宝×DeepSeek年度报告》显示,自去年2月接入DeepSeek以来,元宝持续更新DeepSeek的最新模型,用户规模逐步扩大,去年12月14日当天使用量达到新高,较年初增长超过100倍。

不过,引入外部资本不代表梁文锋会在决策方面向资本方妥协。据网传消息,DeepSeek是以100亿美元估值释放3%的股权,对应融资额约3亿美元,如果估值真的被推高到200亿美元,融资额也不变,释放的股权比例将降至1.5%。

在王超看来,无论是1.5%还是3%,这个比例本身就是一个强烈的信号。“这不是一笔能让资本‘上车掌舵’的交易,只是一张‘站票’。按照以往的风格,梁文锋应该不会释放出足以让大型资本介入决策的股权比例,也不会让任何外部力量获得干预DeepSeek航向的能力,他只是释放一点股份让持股员工吃颗‘定心丸’。”

责任编辑:黄兴利 主编:寒丰