在融资传闻甚嚣尘上之时,梁文锋用一笔增资,做了一次无声的回应。

4月27日,杭州深度求索人工智能基础技术研究有限公司(DeepSeek)悄然完成了一笔关键的工商变更。天眼查APP显示,公司注册资本由1000万元增至1500万元,增幅50%。

打开网易新闻 查看精彩图片

变动最大的,是梁文锋的持股。

他的认缴资本从10万元猛增至510万元,直接持股比例从1%飙升至34%。宁波程恩企业管理咨询合伙企业(有限合伙)的持股则从99%降至66%。算上间接持股,梁文锋合计持有DeepSeek约84.29%的股权,精准踩中有限责任公司重大事项一票否决权的红线。这场变更没有引入新股东,纯内部股权腾挪。

打开网易新闻 查看精彩图片

这家大模型赛道的明星公司,控制权已被创始人牢牢攥在了手心里。

这个时间节点的选择很耐人寻味。就在变更前的一周,市场刚刚经历了新一轮关于DeepSeek融资的传闻轰炸。4月18日有报道称,DeepSeek正启动成立以来的首次外部股权融资,计划以超100亿美元估值募资不少于3亿美元。紧接着,4月22日,又爆出腾讯和阿里巴巴正洽谈投资,公司估值已冲至200亿美元以上。

传言四起的当口,DeepSeek选择了内部增资而非引入外部股东。公开资料显示,梁文锋从公司创立第一天就定下了铁律:不接受外部融资、不稀释股权、不被任何人的商业化时间表绑架。他的底气来自幻方量化。2025年,这家私募的平均收益率高达56.6%,管理规模超700亿元,每年都能拿出数亿元利润支撑DeepSeek的研发烧钱。

而这次增资的核心,可能是为即将破戒的融资,提前焊死话语权。

换句话说,这是先加固自己的堡垒,再决定是否开门。34%的直接持股,就是梁文锋给资本设的防火墙。哪怕融资稀释股权,他也能牢牢攥住一票否决权,绝不让资本干预研发节奏,重蹈太多 AI 公司被资本裹挟的覆辙。

除了防住门外的资本,这笔增资,也是给屋里留不住的核心人才,画了一张能兑现的饼。

AI 圈的人才战,从来都是真金白银的厮杀。近一年来,DeepSeek 核心研发人员接连流失:95 后研究员、DeepSeek-R1 核心作者郭达雅被字节跳动高薪挖走,“AI 才女” 罗福莉加盟小米,LLM 核心作者王炳宣入职腾讯,离职人员覆盖基座模型、推理、多模态四大核心主线。此前没有融资、没有公开估值,员工手里的期权,全是纸面财富,远不如大厂的百万年薪 + 现成股权香。这次股权结构调整,不仅为后续员工持股平台留足了空间,随着融资启动、估值锚定,期权终于有了明确的市场价。留住人,才能守住 DeepSeek 的技术基本盘。

大模型的战场,算力就是弹药,钱就是枪。

现在国内头部互联网玩家,AI 算力年度投入已经冲到千亿级别:字节跳动 2026 年资本支出计划约 1600 亿元,阿里未来三年投入至少 3800 亿元用于 AI 和云计算基础设施建设。单靠幻方每年数亿的输血,在千亿级的军备赛里,根本不够看。DeepSeek 的钱袋子,早就紧了。

打开网易新闻 查看精彩图片

新一代 V4 模型的迭代,万亿参数级的训练,要烧海量算力。市场传闻公司要在内蒙自建数据中心,基建投入是天文数字。今年3月末连续三天的大规模服务异常,更是把基础设施的短板,直接摆到了台面上。拥抱资本,不是想不想的问题,是活下去、跑下去的必选项。

就在增资前三天,DeepSeek抛出了一枚重磅炸弹。

4月24日,全新系列大模型DeepSeek-V4预览版正式发布并同步开源。该模型推出了Pro高性能旗舰版与Flash轻量高效版双版本。其中,Pro版拥有1.6T总参数、49B激活参数与33T预训练数据;Flash版则配备284B总参数、13B激活参数与32T预训练数据。两大版本均支持百万Token超长上下文,将国产大模型引入了百万上下文普惠时代。

技术层面的突破更为关键。其自研的稀疏注意力架构让推理算力消耗大幅降低——Pro版单Token算力仅为上一代V3.2的27%,KV缓存降至10%。在百万Token应用场景下,推理成本较此前实现了大幅下降。根据DeepSeek官方技术报告,V4将细粒度专家并行方案同时在英伟达GPU和华为昇腾NPU上完成了验证,相比非融合基线,在通用推理场景实现1.50至1.73倍加速,在对延迟敏感的强化学习推演和高速Agent服务场景中,最高可达1.96倍。

发布当日,华为昇腾、寒武纪、摩尔线程、海光信息、沐曦股份、百度昆仑芯、阿里平头哥真武、天数智芯等8家国产AI芯片品牌即完成了“Day 0适配”。紧接着,4月27日下午,中国信息通信研究院官方宣布,正式启动DeepSeek-V4国产化适配测试工作。这等于是一次国家级别的权威验证与背书。华为昇腾、海光信息、寒武纪等公司的硬件产品将成为适配验证的核心平台,一旦通过认证,它们将进入DeepSeek-V4的官方推荐算力底座清单,获得巨大的市场先机。

与此同时,DeepSeek的API价格也开始大幅调整。优惠后,输入价格(缓存命中)低至0.025元/百万tokens,输入价格(缓存未命中)3元/百万tokens,输出价格6元/百万tokens。这已是全球大模型中的极低水平,被市场视为用价格优势抢夺份额的凌厉一击。不过,DeepSeek也在官方文章中坦承,受限于高端算力,V4-Pro的服务吞吐目前十分有限,预计下半年昇腾950超节点批量上市后,价格才会大幅下调。

打开网易新闻 查看精彩图片

这暗示着,它的长期定价策略,已经和国产算力芯片的产能释放绑在了一起。

目前来看,梁文锋砸下 500 万换来的 34% 股权,守住的从来不是财富,是不被资本绑架的研发初心。短期内,敲定首轮融资的投资方与最终估值,拿到能撑住算力军备赛的弹药。长期来看,持续迭代模型技术,深化国产算力适配,守住开源大模型的技术护城河,是根本。

AI 圈的下半场,烧钱、抢人、拼技术的混战只会更烈。

DeepSeek 还是梁文锋的 DeepSeek。

来源:星河商业观察