大家好,我是程序员鱼皮。

最近这几年,中国 AI 圈有个说法叫「AI 六小龙」,指的是 2023 年大模型创业潮中跑出来的六家明星公司。它们拿了最多的钱、招了最牛的人、喊了最大的口号,誓要做出中国自己的 GPT。

可能有人还记得更早之前的「AI 四小龙」,也就是商汤、旷视、云从、依图,当年靠计算机视觉撑起了中国 AI 的第一波热潮。但大模型时代到来之后,四小龙集体掉队,取而代之的就是这六家新公司。

快三年过去了,这六家公司的命运走向了完全不同的方向。有的已经上市,市值甚至超过了京东;有的退出了通用大模型竞赛,转向垂直模型和应用落地;还有的被一匹黑马打得措手不及。

今天咱们就来聊聊,中国 AI 六小龙现在到底怎样了?

AI 六小龙是哪六家

这六家分别是智谱 AI、MiniMax、月之暗面(Kimi)、阶跃星辰、百川智能、零一万物。

它们有几个共同特征,创始人全是顶级技术大佬,清一色名校 + 大厂背景、都拿到了超大额的融资、目标都是做通用大模型。

但到了 25 年底,行业里已经不太叫「六小龙」了,而是改口叫「四小强」。因为六家里面有两家已经退出了通用大模型的竞赛。

具体是怎么分化的呢,下面我一家一家来说。

智谱 AI - 全球大模型第一股

智谱 AI 脱胎于清华大学知识工程实验室,2019 年就成立了,是六小龙里资历最老的一家。创始人唐杰是清华教授、ACM Fellow,在学术圈影响力很大。

打开网易新闻 查看精彩图片

2026 年 1 月 8 日,智谱在港交所敲钟上市,成了全球首家以通用大模型为核心主业的上市公司。IPO 认购倍数 1159 倍,开盘即涨,上市几个月后市值一度突破 4000 亿港元。

产品方面,智谱最早走的是 ToB 路线,核心是 GLM 系列模型和 MaaS 平台,把模型能力卖给企业用。后来也开始面向开发者个人推出了 Coding Plan 订阅服务,ToB + ToC 两手抓。2025 年总收入 7.24 亿元,同比翻了一倍多。

我最早接触智谱其实是用它的 CodeGeex 编程插件,那时候还是免费的,体验不错。后来 26 年 GLM-5 系列模型出来之后明显上了一个台阶,Coding Plan 一度供不应求,官方甚至因为限购和涨价发了致歉信。。。

MiniMax - 海外闷声赚钱

MiniMax 的创始人闫俊杰是前商汤科技副总裁,2022 年就出来创业了。

打开网易新闻 查看精彩图片

MiniMax 这家公司有个特别之处,就是它主做 C 端产品,而且主战场在海外。

它旗下的 Talkie(AI 社交陪伴应用)在欧美市场非常火,据招股书披露海外收入占比超过 70%。2026 年 1 月 9 日紧随智谱之后在港交所上市,上市后市值也一度冲到了几千亿港元。

我个人感觉国内用户对 MiniMax 的感知不算强,因为它不像 Kimi 那样直接面向国内用户做产品。但论商业化能力和全球化布局,在六小龙里算是走得最稳的。

 月之暗面 - 半年融了 40 亿美元的 Kimi
打开网易新闻 查看精彩图片
月之暗面 - 半年融了 40 亿美元的 Kimi

月之暗面的创始人杨植麟,清华本科、卡内基梅隆大学博士,是 Transformer-XL 和 XLNet 的核心作者。他 2023 年创立月之暗面的时候才 30 岁出头。

打开网易新闻 查看精彩图片

月之暗面在国内最广为人知的产品就是 Kimi。2025 年 Kimi 推出了 K2 系列模型,到 2026 年初发布 K2.5 之后付费用户出现了爆发式增长,据说近 20 天的收入就超过了 2025 年全年。4 月又发布并开源了 K2.6,在开源模型榜单上表现亮眼。

在资本市场上,月之暗面的融资速度堪称恐怖。26 年以来密集完成多轮融资,累计融资总额超过 39 亿美元,估值从 43 亿美元一路飙到超过 200 亿美元,目前也在准备上市。

我对 Kimi 印象最深的是它的长文本能力,直接丢一份几万字的文档让它总结分析,效果确实不错。

阶跃星辰 - 重视终端落地

六小龙里面,阶跃星辰可能是大家最不熟悉的一家。它不像 Kimi 有国民级 C 端产品,也不像智谱有港股上市的话题度,但它在 B 端和终端落地上其实做得很深。

阶跃星辰的 CEO 姜大昕是前微软全球副总裁,主导过 Bing 和 Microsoft 365 的技术研发。更有意思的是,开头提到的「AI 四小龙」里旷视科技的创始人印奇,后来加入了阶跃星辰担任董事长。

打开网易新闻 查看精彩图片

阶跃星辰跟其他几家最大的区别在于,它从一开始就主打多模态和终端落地。据公司披露,现在国内超过 60% 的头部手机品牌都接入了它的模型能力,装机量超过 4200 万台。汽车领域也在跟吉利合作。

模型方面,2026 年 2 月发布了 Step 3.5 Flash 主打 Agent 场景,刚刚又发布了 Step 3.7 Flash,推理速度每秒最高生成 400 Tokens,已经开源。

据财新报道,2026 年初它完成了超 50 亿元的融资,最近又在进行一轮近 25 亿美元的融资,同时在冲刺港股 IPO。

 百川智能 - 转型做 AI 医疗
打开网易新闻 查看精彩图片
百川智能 - 转型做 AI 医疗

百川智能的创始人是王小川,搜狗的前 CEO。他 23 年创立百川的时候,外界对他的期望很高,觉得这是搜索引擎老将做大模型,天然有场景优势。

打开网易新闻 查看精彩图片

但到了 25 年,百川的策略发生了很大的变化。多位联合创始人离职,公司全面转向 AI 医疗方向。最新的动作是前几天刚刚发布了 Baichuan-M4 医疗大模型,百川称幻觉率降到了 3.3%,同时发布了 AI 家庭医生产品「百小医」。王小川说账上还有 30 亿,不急着融资,计划 2027 年上市。

打开网易新闻 查看精彩图片

我觉得放弃通用大模型这个决定其实挺需要勇气的。在其他家都在卷通用能力的时候选择收缩到垂直领域,到底是明智还是遗憾,现在还不好下定论。

零一万物 - 最早放弃追逐超大模型预训练

零一万物的创始人是李开复,前 Google 大中华区总裁、创新工场创始人。他在 23 年高调宣布做大模型创业,一度引起了很大的关注。

打开网易新闻 查看精彩图片

但到了 25 年初,零一万物做了一个让行业震动的决定,把大部分训练和 AI infra 团队并入阿里,相当于公开承认不再追求自研超大模型了。之后它转型做 ToB 的 AI 应用服务,25 年经审计收入 2.5 亿元,26 年订单已经超过 15 亿元。

李开复前几天在零一万物三周年内部致辞里说,明年(2027 年)零一万物将成为「中国首家盈利的 AI 2.0 公司」。口号不小,但至少数据上看确实是在往好的方向走。

搅局者 DeepSeek

虽然它不在原始的 AI 六小龙名单里,但它对整个格局的冲击可能是最大的,所以聊六小龙不能不提 DeepSeek。

打开网易新闻 查看精彩图片

DeepSeek 的创始人梁文锋是量化私募幻方量化的老板,23 年创立 DeepSeek 后一直没拿外部融资,完全靠自己的钱养。25 年 1 月 DeepSeek-R1 发布,以极低的训练成本做出了对标 OpenAI o1 的推理能力,直接震动了整个行业,连美股都跟着抖了一下。

打开网易新闻 查看精彩图片

那段时间 DeepSeek 彻底出圈了,我妈都在用,身边完全不懂技术的朋友也在转发。后来 26 年 4 月 DeepSeek-V4 问世,发布之前就有一大波自媒体(包括我)给它打了预告,热度爆炸。

到了 26 年,据报道 DeepSeek 正在推进首轮外部融资,投前估值约 450 亿美元,国家大基金被曝领投。

它之所以开始融资,一个重要原因是核心人才被大厂高薪挖走,比如核心开发者罗福莉被雷军千万年薪挖到小米,大语言模型核心作者王炳宣去了腾讯。需要通过股权激励来留住剩下的人。

我现在 AI 编程用得最多的国产模型就是 DeepSeek,尤其是 V4 出来之后,100 万 token 上下文加上性价比,真的很能打。

最后哔哔

整体来看,六小龙的命运已经分成了三种走向:智谱和 MiniMax 成功上市,月之暗面和阶跃星辰正在冲刺 IPO,百川和零一万物选择了转型。

对程序员来说,我觉得有几个值得关注的点。

1)AI 公司还在大量招人。据脉脉报告,2026 年 1 至 4 月 AI 岗位量同比增长近 9 倍,平均月薪接近 5 万。尤其是 Agent 方向,DeepSeek、月之暗面、阶跃星辰都在抢人。

2)门槛在分化。核心算法岗还是要名校硕博加顶会论文,但 AI 应用层的岗位,比如 RAG 开发、Agent 搭建,对传统程序员来说转型门槛没那么高,现在正是窗口期。

3)大厂也在加速布局。字节的豆包月活超过 3.4 亿,阿里的通义千问系列在开源界非常能打,连 Claude Opus 4.8 被人用中文问「你是什么模型」的时候都冒出一句「我是通义千问」,可见一斑。创业公司和大厂之间的人才争夺越来越激烈。

总的来说,过去一年各大 AI 公司的模型能力进步非常快。不管你最终去不去这些公司,都要学会用好 AI 模型,已经是这个时代程序员的基本功了。

我是鱼皮,持续分享 AI 编程和程序员成长的干货。觉得有用的话记得点赞收藏和关注~

也欢迎在评论区聊聊:你最看好哪家的大模型?