不知道大家有没有注意到,去年年初红得发紫的Deepseek和梁文锋,现在都没什么声音了。
去年没有抓住宝贵时间窗口进行融资和发展的Deepseek,可能已经错过了成为万亿企业的机会,梁文锋也遗憾地错失了本来可以争取的首富地位。
现在的国产AI大模型,不仅有三大互联网巨头字节跳动的豆包、阿里巴巴的千问、腾讯的元宝,还有港股上市的Minimax、智谱,即将上市的月之暗面Kimi。连做大模型不久的小米,最近也靠着开源,做到了全球大模调用量榜单的第一名。
不说几家巨头的实力和资源,就算是Minimax、智谱,现在市值也都超过3000亿,月之暗面上市市值也会到两三千亿水平。那么Deepseek现在的地位就很尴尬了。
去年初横空出世后,Deepseek几乎就是国产大模型的代名词,一度人们认为Deepseek会成为新的巨头、万亿级企业,连胡润富豪榜去年也给梁文锋估了1846亿的身价。
但是梁文锋拒绝了进行融资,也没有加大投资。所以在国内互联网巨头们纷纷投下巨资投入大模型领域,智谱、Minimax、Kimi等公司不断融资上市后,Deepseek出镜率越来越低。
不少人说梁文锋有量化投资公司幻方量化,可以随意在股市割韭菜,不缺钱,也看不上大模型领域这点钱,所以不融资。这种说法明显不成立。
媒体最新报道的收益率,幻方量化的表现并不算好,幻方目前管理的投资基金规模也远没有千亿,这里面还主要是其他投资人的钱。
成也萧何败也萧何。最早Deepseek也只是梁文锋股市投资之余做出来的副产品。他可能从没有想过把Deepseek单独做大做强,这才让Deepseek错失了发展的良机。
去年初Deepseek要融资的话,投资机构肯定会争相投资,现在则时过境迁,国内AI大模型行业已经百花齐放,巨头、小龙林立。
同样作为杭州六小龙的领军者,与梁文锋的低调拒绝融资截然相反,现在如日中天的王兴兴和宇树科技,就抓住风口机会在过去一年完成了几轮融资,还申报了科创板上市,可能两三个月内就能成功IPO。
人形机器人和AI大模型领域一样,处于风口的行业,马上会有无数巨头和资金涌入,慢一步就可能丧失市场领先地位。
王兴兴和梁文锋的不同选择,决定了如今宇树科技和Deepseek的不同境遇。宇树科技坐稳了国内人形机器人市场的老大位置,而Deepseek却让自己处在AI大模型市场一群巨头、小龙的竞争之中。
在该跨越式发展的时候不抓住机会,错过的也不只是投资,也包括人才。Deepseek虽然给核心员工工资很高,但在AI人才薪资爆炸,各家巨头和创业公司纷纷开出巨额年薪,还给期权、股份的竞争下,Deepseek核心人才也陆续出走。
罗福莉是V2/V3/MoE核心研究员,现在已经是小米大模型团队的负责人,罗福莉领衔研发出的 MiMo-V2-Pro,已经是全球开源大模型的调用量全球第一。
郭达雅是DeepSeek-R1(Nature封面)第一作者,代码智能与数学推理线负责人,V2/V3/Coder/Math系列核心作者。近期也已离开Deepseek。
Deepseek还有一名准CTO级别高管,是公司核心技术高管,参与大模型整体技术架构规划,也离职创业聚焦AI agent领域,并获得头部VC投资。
当然说Deepseek错过了宝贵的发展机会,错失了国内大模型市场的领军地位,并不是说Deepseek现在已经失败,或者被市场淘汰。Deepseek仍然是国内大模型领域的头部企业,也不断在学术和技术上取得突破,不管在国内还是国际市场,仍然受人尊敬。
Deepseek正在做的V4+R2双旗舰,拥有万亿参数、原生多模态、百万上下文、长期记忆,且全链路适配华为昇腾。虽然发布时间出现延期,但一旦成功发布,还是有可能带来轰动性影响。
去年1月20日DeepSeek发布R1模型,以极低算力/成本实现顶尖推理性能,彻底打破“算力即权力”的行业铁律,成为全球AI从堆硬件转向拼算法效率的分水岭,被人们称为AI大模型的Deepseek时刻。
过去一年,AI大模型行业已经发生了天翻地覆的变化,我们还是期待梁文锋和Deepseek能继续带来新的惊喜。