打开网易新闻 查看精彩图片

作者|Hayward

原创首发|蓝字计划

百度昆仑芯,在最近毫无悬念地成为了国产AI芯片赛道的主角。

一边,它已经以保密形式向港交所递交上市申请;另一边,昆仑芯也完成了科创板上市辅导备案,A+H双线推进的轮廓逐渐清晰。

按照市场消息,昆仑芯最新一轮融资后的估值,已经达到约210亿元。

打开网易新闻 查看精彩图片

这意味着,百度内部孵化多年的AI芯片业务,终于接近开花结果的重大时刻。

但是,如果回过头来看昆仑芯最早的起点,并没有今天看上去这么风光。

李彦宏当年的那一句话,成了概括昆仑芯诞生的最好注脚:

当初我们做搜索的时候,买别人的芯片太贵了,每片要1万美元。而我们自己做,2万人民币就做下来了。

这句话怎么都不像一个宏大的造芯宣言,反而多多少少带有一些无奈。

早年的百度,核心业务是搜索,背后依赖的是海量计算。排序要算,广告要算,语音识别、推荐系统也都要算。

业务越做越大,算力成本自然也越来越高。外采芯片当然省事,但长期买下去,账单上的真金白银,肯定也会让李彦宏皱眉。

正是在这个背景下,百度在内部启动了自己的AI加速计算探索。

而这个如今估值达约210亿元、正在冲刺IPO的昆仑芯,正是百度原本想用自研方案,把搜索和AI计算的成本降下来,最终鼓捣出来的一个“省钱工具”。

但这也是昆仑芯最有趣的部分:

一个为了省钱做出来的业务,怎么就撑起了两百多亿估值?

昆仑芯的前世今生

要理解昆仑芯凭什么能值两百多亿,还是看回它最初的起点。

前文提到,随着百度的业务越走越大,算力成本越来越高,他们需要一个实用的办法,降低算力成本。

不过在当时,百度没有选择立即去造一颗完整的专用芯片,而是先从更灵活、风险更低的方案入手。

这就是FPGA。

FPGA可以简单理解成一种能反复改造的“半成品芯片”,在根据不同任务重新配置后,就能用来给搜索、语音识别、推荐这类高频计算做加速,节省算力。

早在2011年,百度开始在内部启动FPGA AI加速项目。

从2011年到2015年,百度数据中心里的FPGA部署规模超过5000片;到了2017年,这个数字进一步提升到12000片。

搜索排序、广告系统、语音识别、推荐系统,都是百度最核心的业务场景。FPGA在这些场景里的部署,意味着百度内部这条AI加速技术线,已经从“试试看”进入了真实业务。

2017年,这条技术线迎来一个关键节点。

百度在Hot Chips上发布自研XPU架构。相比继续用FPGA做局部加速,XPU的出现意味着百度把自己多年积累下来的AI计算需求,整理成了一套更系统的芯片架构。

2018年,百度终于在AI开发者大会上正式发布第一代云端AI芯片“昆仑”。

打开网易新闻 查看精彩图片

自此,从FPGA到昆仑芯,百度完成了从内部AI加速方案到拥有AI计算自研芯片的转向。

2020年,第一代昆仑芯实现量产,并在百度搜索、语音识别等场景中落地。

不过,真正让昆仑芯身份发生变化的时间节点,是2021年。

这一年,昆仑芯完成独立融资,正式从百度内部走出来。百度芯片首席架构师欧阳剑出任CEO,昆仑芯也从百度体系里的一条技术线,变成了一家可以独立融资、独立面对市场的芯片公司。

首轮融资后,昆仑芯的估值就已经达到约130亿元。

此后几年,昆仑芯继续融资,并引入更多产业资本。比亚迪、中国移动旗下基金等机构入局,让它和外部产业客户的关系变得更深。它们给昆仑芯带来的不止有钱,还有更多真实的客户、场景和订单。

正是从2021年开始,独立运营近5年的昆仑芯,终于走到IPO的前夜。

几斤几两?

当然,师出有名不代表昆仑芯天生就能叱诧风云。既然已经放到了商业市场里检验,大家更加关心的还是昆仑芯自身的实力,到底有几斤几两。

对一家商业化的AI芯片公司来说,真正进入商业市场后,市场会更加关心芯片有没有被大规模用起来,能不能跑大模型这样的核心任务,最后能不能变成收入和估值。

甚至当客户把芯片买回去后,还要迁移模型、适配框架、跑集群。软件和生态能不能及时配套,也会直接影响产品后续的转化。

所以,出货量是第一个关键的评价指标。

据媒体援引IDC 2025年度数据,中国AI加速卡全年出货约400万张,其中英伟达约220万张,仍然拿走55%的市场;

国产厂商合计约165万张,份额提升到41%。

在国产厂商里,华为昇腾仍然断层领先,出货约81.2万张;阿里平头哥约26.5万张;昆仑芯和寒武纪均约11.6万张,并列第三。

这个数据非常关键。既然已经走到了国产第三的位置,就证明昆仑芯已经不是国产AI芯片里的边缘玩家。它和寒武纪站在同一出货量级,并且排在海光、沐曦、天数智芯等厂商前面。

要知道,和昆仑芯出货量一个级别的寒武纪可是有“寒王”之称,市值也已经近 8000亿。如果昆仑芯正式上市,保守来看市值达1000-2000亿不是问题。

只不过,比下有余却比上不足。昆仑芯和华为昇腾之间仍然差着很远。81.2万张对11.6万张,大约是7倍差距;如果再把英伟达放进来,差距更大。

所以,在出货量这层级,昆仑芯虽然已经进入了国产AI芯片的牌桌,甚至已经称得上了头部玩家,但距离赛道第一的选手,还有不小差距。

能撑起这个出货量的,首先还是产品力。

目前最能代表昆仑芯产品力的,是P800。

打开网易新闻 查看精彩图片

按照公开资料,P800已经支持单机8卡部署DeepSeek V3/R1 671B满血版大模型,也实现了万卡集群部署。

国信证券研报中还提到,昆仑芯P800的FP16算力达到345TFLOPS,部分推理性能口径超过A800。

作为参照,华为昇腾910B是国产高端算力卡里最有代表性的产品之一。公开资料中,昇腾910B的FP16算力常见口径大约在320TFLOPS到400TFLOPS之间,搭载64GB HBM2e显存。

打开网易新闻 查看精彩图片

也就是说,如果只看公开资料中的FP16峰值算力口径,P800和昇腾910B之间的差距,其实并没有那么大。

而且,P800作为一款AI计算卡,已经进入了真实的商业场景。昆仑芯官方披露,P800单机8卡一体机已经通过DeepSeek-V3/R1 671B满血版适配支持性测试,支持长上下文推理,精度与DeepSeek技术报告对齐。

但问题在于,AI芯片的产品力,不只是一张卡的纸面算力。

尤其到了大模型时代,比一块孤零零的芯片更重要的,是一整套能跑起来的算力系统。

芯片本身的性能水平,只是一切的基础;后面的框架适配、模型迁移、算子优化、集群调度、工程服务,都会影响客户最终要不要大规模采购。

这也是昆仑芯相比行业龙头还欠缺的地方。

昇腾910B的最大优势,是有一整套华为体系支撑。芯片、服务器、华为云、CANN、MindSpore、行业方案、政企客户服务,基本都是打包到一起的。

对很多客户来说,买昇腾不只是买计算卡,而是买一套已经有人帮你适配、部署、维护的国产算力方案。

只能说,昆仑芯暂时还没能达到这个程度。

尽管当前有百度飞桨可以和昆仑芯形成协同,P800也已经适配了DeepSeek等大模型,但更广泛的开发者生态、行业方案、小众框架兼容、客户服务体系上,仍然要补课。

这就解释了为什么昆仑芯的单卡纸面水平并不差,出货量也已经站到国产前列,但还没有真正追上昇腾。

百度真正赚到的

虽然昆仑芯还没有坐上国产AI芯片的头把交椅,但不影响它对百度非常重要。

换句话说,就算它考试没考第一,但已经足够给百度长脸。

因为对百度来说,昆仑芯终于把百度过去多年埋在底层的AI硬资产,单独呈现到资本市场面前,这才是最重要的。

毕竟在过去,百度讲AI,市场其实非常难给他算账的。

文心大模型、智能云、小度、搜索重构,虽然是百度AI的一部分,但它们都包在集团业务里,很难被拆出来单独估值。

现在昆仑芯就不一样了,它有融资、有估值、有出货、有外部客户,也有明确的上市路径。

这就让百度的AI能力,第一次有了一块更容易被市场清晰计算的硬资产。

而且这个硬资产,让百度收益颇丰。

按最新一轮约210亿元估值计算,百度持有昆仑芯57.67%股权,这不是一笔小钱。如果昆仑芯成功上市,并且在公开市场获得更高定价,百度手里这部分股权价值,也会水涨船高。

但对百度来说,钱只是非常表面的价值。

昆仑芯更重要的意义,是帮百度打开了AI芯片业务继续融资和扩张的通道。

芯片是典型的重投入生意。研发、流片、迭代、集群、软件适配,每一步都要钱。如果一直留在百度内部,昆仑芯就始终要和百度其他业务争资源;独立上市之后,它就可以用自己的出货、客户和增长去融资。

这对后续产品迭代很关键。

此外,独立上市也能帮昆仑芯逐渐淡化“百度子公司”的标签,对外部客户来说,尤其是一些和百度存在竞争关系的互联网公司,淡化标签之后就更容易和昆仑芯实现合作。

只有昆仑芯的独立性更强,外部客户更多,它才有机会从百度自己的芯片业务,变成一家真正面向市场的AI芯片公司。

最后,昆仑芯的终极价值,还在于终于让百度拥有了一张在AI时代最难能可贵的名片:硬件玩家。

英伟达依靠GPU成为全球市值最高的公司、华为依靠昇腾和整套政企、云、服务器生态,站上国产AI算力的核心位置,还有生产AI必须的内存部件的海力士、美光、三星,也赚得盆满钵满。

这些公司的成功就足以说明,在AI时代,AI越智能,对硬件的依赖只会越强。

而昆仑芯则能让百度在模型、云和应用之外,多了一张AI硬件牌,拥有了在未来和其他头部企业一起构筑AI时代地基的能力。

如果未来百度能够走到AI时代的前列,昆仑芯会是当前最有希望的助推器。