拒绝融资2年、把投资人拒之门外的DeepSeek,突然要融3亿美元?估值还超100亿?

先回答最扎心的问题:DeepSeek缺不缺钱?从账面上看,真不缺。背后的幻方量化2025年平均收益率56.6%,管理规模700亿,一年收入约50亿。

答案藏在AI行业的范式切换里:从Chatbot到AI Agent。过去Chatbot是“一次训练反复用”,训练成本几百万美元,推理成本可控;但现在Agent的逻辑完全不同——它要执行整条条任务链,规划、调用工具、纠错,一个复杂任务的推理token是Chatbot的几十倍甚至上百倍。

打开网易新闻 查看精彩图片

推理成本开始逼近训练成本,两者一起指数级膨胀。更要命的是,模型参数从千亿级向万亿级跨越,DeepSeek过去用500万美元训出V3的“以巧胜拙”打法,在Agent时代的高赌注面前,已经不够用了。幻方的50亿,在Chatbot时代绰绰有余,但Agent时代,这点钱可能连一次大模型迭代都撑不住。

3亿融资的目标不只是钱,还有Agent需要的真实场景。今年3月,DeepSeek一口气放出17个Agent岗位:算法研究员要做强化学习对齐,数据评测要测规划和工具调用,基础设施要搭Agent底层基座。

打开网易新闻 查看精彩图片

Agent的能力不是模型强就自然有,它需要在真实场景里摔打——比如多工具调度、长期记忆、模糊指令规划,这些实验室里训不出来。而好的场景哪里来?靠战略投资方的产业网络。一个有B端生态的投资方,能直接提供金融、办公等垂直场景,这种“场景协同”比钱更值钱。

有人说DeepSeek被大厂追上了,所以融资追赶?错了。DeepSeek的定位是前沿实验室,核心价值是输出可复用的方法论。

2026年元旦,它发布mHC架构,动了Transformer最基础的残差连接;V3.2的DSA机制被寒武纪四分钟适配、智谱GLM-5借鉴;OCR模型3B参数超越百亿级,被匹兹堡大学引用。这些技术创新,是大厂短期内追不上的。融资不代表改变方向,只是给前沿探索加燃料。

大洋彼岸的Anthropic是面镜子:2024年营收10亿,2026年4月达300亿,靠的是企业API和Claude Code,用户量只有ChatGPT的5%。

打开网易新闻 查看精彩图片

更关键的是效率——OpenAI2030年训练成本预计1250亿,Anthropic才300亿,还能更早实现正向现金流。它证明:商业化不是研发的敌人,反而能支撑不受制于人的持续投入。DeepSeek不需要复制Anthropic,但至少看到可能性:有限商业化能给研发更多试错空间。

最后问:融资会改变DeepSeek的AGI目标吗?不会。Agent本就是它的既定路线——2025年9月开发Agent功能,12月V3.2强化Agent能力,2026年3月招Agent岗位。3亿融资只是战略补给,不是投降。

AI行业进入Agent时代,参数、成本、人才、场景的需求都变了,原本靠方法论弥补资源差距的窗口期在收窄。DeepSeek融资,是为了储备弹药、锁定人才、接入场景,不是向资本低头,而是让自己在Agent时代更有底气。

你觉得DeepSeek这次融资能帮它在Agent赛道突围吗?是继续保持极客本色,还是会被资本影响?评论区说出你的观点,点赞收藏让更多人看到AI行业的真相!