今年下半年,国产GPU独角兽迎来IPO潮。
2024年8月,上海燧原科技股份有限公司在上海证监局进行辅导备案登记,辅导机构为中金公司。
燧原科技从成立之初就自带光芒,成立六年时间内已完成十轮融资,累计融资额近70亿元,间腾讯多轮投资,成为燧原科技的第一大股东,持股比例为20.49%。在今年的《2024·胡润全球独角兽榜》上以160亿元人民币的估值排行第482位。
2024年9月,上海壁仞科技股份有限公司在上海证监局完成了辅导备案登记,辅导机构为国泰君安。壁仞科技已完成多轮融资,融资总额超过50亿元,投资方包括启明创投、IDG资本、华登中国,平安集团、高瓴创投、格力创投、松禾资本、云晖资本、国盛资本、招商局资本等机构。2024年4月9日,壁仞科技以155亿人民币的企业估值入选《2024·胡润全球独角兽榜》,排名495名。
2024年11月,摩尔线程智能科技(北京)股份有限公司在北京证监局办理辅导备案登记,正式启动A股上市进程,辅导机构为中信证券。
摩尔线程共经历六轮融资,背后聚集一众知名投资方,包括红杉中国、深创投、腾讯投资、中关村科学城等。2024年4月9日,摩尔线程以255亿元的估值位列《2024·胡润全球独角兽榜》第261名。
01、信创叠加美国禁令,带来巨大市场空间
GPU作为信创产业的核心硬件之一,可为政府、金融、电信等行业提供自主可控的图形处理和高性能计算能力,市场规模巨大,国产AI也为国产GPU的发展提供契机。在国际供应链不确定性背景下,未来三年是国产GPU发展的关键窗口期。
根据IDC的《中国半年度加速计算市场(2023全年)跟踪》报告,2023全年,中国加速服务器市场规模达到94亿美元,同比2022年增长104%。其中GPU服务器依然是主导地位,占据92%的市场份额,达到87亿美元。其余NPU、ASIC 和 FPGA等非GPU加速服务器占据近8%的市场份额,超过7亿美元。
近年来,政府对于智算中心建设的重视程度不断提升,通过出台《新型数据中心发展三年行动计划(2021-2023年)》《“十四五”国家信息化规划》《“十四五”数字经济发展规划》等一系列政策,为智算中心的发展提供了坚实的政策保障。
数据显示,截至2023年底,全国名称中带有“智算中心”的项目已达128个,仅2023年全年,全国建成或者正在建设的智算中心有20多座,且这一数字在2024年继续快速增长。近年来国内新建设的数据中心、智算中心都已经逐步采用国产芯片设计,为国内企业创造了巨大的市场空间。
如壁仞科技成为了中国电信的算力合作伙伴,同时搭载壁砺系列通用GPU算力产品的中国移动智算中心(呼和浩特)已成功上线运营。这家智算中心属于全国型N节点万卡训练场,单体算力达6.7EFLOPS(FP16),也验证了壁仞宣称的产品可以用于千卡集群建设方案,并可扩展至万卡规模的互联技术的落地能力。
摩尔线程也针对自己的AI旗舰产品夸娥(KUAE),推出了一整套解决方案,其中包括夸娥集群管理平台(KUAE Platform)以及夸娥大模型服务平台(KUAE ModelStudio)。同时也一口气签约了青海零碳产业园万卡集群项目、青海高原夸娥万卡集群项目、广西东盟万卡集群项目。
国产GPU产品正处于导入信创领域阶段,未来向其他领域进一步衍生。比如近期智绘微电子的二代桌面显卡与飞腾腾锐处理器完成兼容性适配认证,表明二者搭配能够良好运行,为信创国产化应用提供良好的计算能力。
摩尔线程CEO张建中透露,公司从2022年开始,便已经陆陆续续在信创行业中应用,大大小小的标中了不少,行业用户应用也比较多。“相信在国内,各大企业和行业用户,他们对于国产化要求现在越来越多,而且在采购需求中都明显鼓励使用国内产品。”
从国际环境来看,美国对相关技术及产品的管控,也激发了中国本土厂商自研芯片的积极性,将带动国产GPU的落地应用。2022年,美国当局禁止英伟达向中国出口高性能GPU芯片(A100、H100);2023年,阉割版的A800、H8009、L40、L40S、甚至普通桌面端显卡RTX4090都在禁售之列;2024年12月,相关媒体披露称,拜登政府计划在本月底前发布一项新规则,进一步升级对华芯片禁令,旨在阻止中企从第三方采购先进AI芯片。
与此同时,中国政府也对英伟达展开了反垄断调查,多个行业协会发声警告美国产品的不可靠性。这些动作不仅是对国际供应链不稳定的应对,也是为国产GPU发展创造市场空间的战略布局。通过政策干预,削弱外资品牌的市场支配力,能为国产GPU提供“试验窗口”。
02、国产GPU,苦CUDA久矣
面对英伟达CUDA生态的强势地位,国内AI生态链建设显得尤为迫切。英伟达凭借其完善的生态链,成为了全球AI大模型的首选算力供应商,甚至国内众多GPU公司也不得不依赖其生态。
图源:数据猿
相比之下,由于起步较晚、核心知识产权差距较大以及需要巨额资金投入,国产GPU在初始阶段普遍选择兼容现有生态系统,缺乏独立的核心技术。比如摩尔线程的MUSA生态、壁仞科技的BIRENSUPA平台、沐曦科技的MXMACA平台都声称可以兼容CUDA,但是从实际情况来看,国产GPU对CUDA兼容的完善度未必是100%。
2018年,华为建立了自己的达芬奇架构,当时华为昇腾310芯片首次亮相,也标志其达芬奇架构正式被应用。和CUDA类似,华为达芬奇核心优势也在于做运算加速,采用3D Cube,据数据猿,每个AI Core可以在一个时钟周期内实现4096个MAC操作,相比传统的CPU和GPU实现数量级的提升。
从设计目标来看,CUDA更看重通用性,支持大规模并行处理能力,适合处理各种复杂的计算任务,所以也被广泛应用在科学研究、医学、金融等多个领域;达芬奇架构更主要针对AI计算,特别是在端侧、边缘侧及云端的AI应用场景中,比如国内最受欢迎的自动驾驶、智能手机以及云场景。
越来越多的国产GPU厂商意识到生态建设的重要性,并积极与上下游企业、科研机构等展开合作,共同构建完整的产业生态。如摩尔线程与众多行业合作伙伴联合展示了基于其智算集群的丰富行业大模型应用方案,推动了国产GPU在各领域的应用和发展。
在支持大模型应用方面,燧原科技和智谱AI合作推出了大模型编程助手一体机,基于云燧i20推理加速卡,能为软件开发企业提供一系列AIGC功能(如代码生成、代码翻译、代码注释、代码补全、智能问答);沐曦科技则利用自己的曦思N100,与眸瑞科技联合发布了首个AI模型“贴图超分”技术。
国产GPU在性能和制造能力上的追赶已经初见成效,但生态建设仍是“最后一公里”。这不仅是技术挑战,更是时间和信任的积累过程。国产GPU厂商需要联合产业链上下游,构建协同发展的生态体系。通过与国内的AI应用开发商、科研机构和云服务商合作,推动更多垂直行业采用国产GPU。这种自上而下的市场引导,可以有效带动开发者群体的扩展。
03、国产GPU,准备好了吗
当前全球PC GPU芯片市场主要由英伟达、英特尔和AMD三家厂商垄断,国内厂商加速布局。国产GPU公司主要有两大方向,一类是面向图形处理的GPU芯片,包括景嘉微、芯动科技、摩尔线程、芯瞳半导体等;另一类是面向通用计算的GPGPU芯片,包括寒武纪、壁仞科技、海光信息、沐曦等。
近年来,国产厂商在GPU赛道发力,推出了较为成熟的产品,在性能上不断追赶行业主流产品,在特定领域达到业界一流水平。
景嘉微
景嘉微成立于2006年4月,是国内首家成功研制国产GPU芯片并实现大规模工程应用的企业。掌握了包括芯片底层逻辑/物理设计、超大规模电路集成验证、模拟接口设计、GPU驱动程序设计等关键技术。
景嘉微的GPU产品包括JM5400、JM7200、JM9系列和景宏系列,覆盖传统领域和新兴领域。JM5400是景嘉微早期推出的一款GPU产品,标志着国产GPU的起步;景宏系列是景嘉微今年成功研发的产品,主要用于AI训练、AI推理和科学计算等领域。
海光信息
计算加速上,海光的主要产品是DCU,海光DCU系列产品以GPGPU架构为基础,兼容“类CUDA”环境,主要适用于AI相关场景,为大数据处理、人工智能、商业计算应用提供通用解决方案。
目前,海光DCU系列产品深算二号已经发布,实现了在大数据、人工智能、商业计算等领域的商用。深算二号具有全精度浮点数据和各种常见整型数据计算能力,性能相对于深算一号性能提升100%以上,填补了国内高端通用AI芯片的空白。
寒武纪
寒武纪成立于2016年,是一家专注于人工智能芯片产品的研发与技术创新的公司,致力于打造人工智能领域的核心处理器芯片,让机器更好地理解和服务人类。寒武纪的产品线涵盖了终端智能处理器IP、云端智能芯片及加速卡、边缘智能芯片及加速卡,以及与上述产品配套的基础系统软件平台。
寒武纪的思元370是采用先进制程工艺,首款采用chiplet芯粒技术的AI芯片,就是在一颗芯片中封装2颗AI计算芯粒,每一个MLU-Die具备独立的AI计算单元。整体集成了390亿个晶体管,具有256TOPS(INT8)的最大算力。
龙芯中科
龙芯中科于2020年成立GPU突击队,加快GPU产品的研发设计。目前,龙芯中科自主研发的GPU集成在7A2000中。龙芯7A2000是面向服务器及个人计算机领域的第二代龙芯3号系列处理器配套桥片,在7A1000基础上实现全面的优化升级。此外片内首次集成了自研GPU,采用统一渲染架构,搭配32位DDR4显存接口,最大支持16GB显存容量。
华为昇腾
华为昇腾910B是华为自主研发的AI芯片,采用了先进制程工艺,昇腾910代表了昇腾系列的最强算力,其半精度FP16算力达到了320TFLOPS,整数精度INT8算力更是高达640 TOPS。昇腾910配合华为开源的MindSpore框架,可以显著提高AI训练的效率。
摩尔线程
摩尔线程成立于2020年10月,是一家以全功能GPU芯片设计为主的集成电路高科技公司,主要开发面向元计算应用的新一代GPU,构建融合视觉计算、3D图形计算、科学计算及人工智能计算的综合计算平台,建立基于云原生GPU计算的生态系统,采用先进MUSA架构。
摩尔线程从2022年11月推出全功能GPU芯片“春晓”,到2023年9月发布新一代全功能GPU芯片“曲院”,还基于“曲院”推出AI训推一体计算卡MTT S4000和夸娥(KUAE)千卡智算集群,并自研大语言模型MusaChat。
燧原科技
燧原科技成立于2018年3月,是国内第一家同时拥有高性能云端训练和云端推理产品的创业公司,也是国内第一个发布第二代人工智能训练产品组合的公司。成立6年来,燧原科技共开发了4代5颗芯片,核心业务涵盖了芯片、板卡、智算一体机、液冷算力集群以及配套的软件系统,包括基于“邃思”的云端训练加速卡“云燧T10”和第一代推理产品“云燧i10”以及第二代训练产品“云燧T20/T21”和推理产品“云燧i20”,还有配套的“驭算”软件平台等等。
“邃思2.0”是迄今为止中国最大的AI计算芯片,尺寸为57.5毫米×57.5毫米(面积为3306mm2),达到了日月光2.5D封装的极限,与上代产品一样采用格罗方德12nm FinFET工艺,内部共整合9颗芯片,单精度FP32算力为40TFLOPS,单精度张量TF32算力为160TFLOPS,整数精度INT8算力为320TOPS。
壁仞科技
壁仞科技成立于2019年,团队在GPU、DSA(专用加速器)和计算机体系结构等领域具有一定的技术积累。在发展路径上,壁仞科技首先聚焦云端通用智能计算,再逐步过渡到人工智能训练和推理、图形渲染等多个领域。
BR100系列通用GPU芯片是国内算力最大的通用GPU芯片,包括BR104和BR100两大产品,基于自主原创的芯片架构开发,采用7纳米工艺制程,并结合了包括Chiplet等在内的多项业内前沿芯片设计、制造与封装技术。其中BR104对标英伟达2020年推出的A100、BR100对标英伟达4nm芯片H100,BR104 FP32算力为128T FLOPS,BR100 FP32算力为256T FLOPS。此外,壁仞科技还推出了首款国产高端通用GPU“壁砺”系列,已量产落地。
壁仞科技与浪潮科技合作推出了搭载BR100的OAM服务器 “海玄”,其峰值浮点算力达 8PFLOPS,最大功耗为7KW,为数据中心提供了高能效、低 TCO(总拥有成本)的数据中心集群方案,可满足数据中心对大规模数据处理和高性能计算的需求,支持云计算、大数据分析、人工智能等多种应用的运行。
天数智芯
天数智芯成立于2015年12月,2018年正式启动GPGPU芯片的设计研发工作,是国内首家GPGPU高端芯片及超级算力提供商。天数智芯已经发布了两款自主研发的通用GPU产品天垓100、智铠100,具备应用覆盖广、开发易迁移、性能可预期、全栈可定制、使用成本低等特点。
天垓100是天数智芯推出的全自研通用GPU训练产品。它采用通用GPU架构,兼容国际主流GPU通用计算模型,支持国内外主流AI生态和深度学习框架及原生算子。2022年底,天数智芯曾宣布天垓100累计销售订单已突破5亿元。
智铠100系列加速卡基于通用GPU架构,支持多种视频规格解码、800+通用指令集、国内外主流深度学习开发框架。兼容CUDA生态,支持市场主流生态,高达128路视频接入。平均迁移时间相较市场主流产品下降50%以上,生态应用迁移迅速。
登临科技
登临科技专注于芯片研发与技术创新,致力于打造云边端一体、软硬件协同的前沿芯片产品和平台化基础系统软件。公司自主创新的GPU+(基于GPGPU的软件定义的片内异构计算架构),在兼容CUDA/OpenCL在内的编程模型和软件生态的基础上,通过架构创新,完美解决了通用性和高效率的双重难题。
登临首款基于GPU+的创新AI计算加速器Goldwasser已规模化运用在各个应用场景。未来将继续秉承核心IP全自研的架构实现,以AI计算为主线,以创新为灵魂,加强核心IP自主研发,加速产品在高级自动驾驶,图形加速等相关领域的开拓创新和商业化进程。
中微电科技
中微电科技创立于2009年4月,始终坚持完全自主知识产权的原则,专注GPU研发,是国内屈指可数的集处理器内核IP和解决方案为一体的企业,相关芯片已经应用于智能家居,边缘计算和人工智能等领域。
中微电的GPU产品有南风一号、南风二号、南风三号。“南风一号”GPU主要应用于信创计算机显示可满足党政、金融及安防等信创产业链专用整机电脑PC显卡需求。“南风二号”提供高性能并行计算能力,满足服务器、训练机、推理机、边缘计算、科学仿真计算、智算中心等人工智能市场需求。
2023年12月,“南风一号”导入了世恒TD120A2整机,标志着产品已经通过了中国长城各项功能、性能、可靠性、兼容性、稳定性等测试。“南风一号”也与麒麟操作系统(V10 SP1)、飞腾处理器(D2000、FT2000)、奇安信浏览器等多家国产设备、应用实现兼容性互认证。
瀚博半导体
瀚博半导体成立于2018年12月,是一家GPU芯片提供商,致力于为人工智能核心算力和图形渲染、内容生成、AIGC提供全栈式芯片解决方案。瀚博目前拥有自主研发的核心IP以及两代GPU芯片,并衍生AI、渲染、视频三大产品线。
据介绍,其2023年推出的第二代GPU SG100芯片,采用7nm先进制程,具备业界一流的渲染性能,同时兼具低延时高吞吐的AI算力和强大的视频处理能力,可广泛支持数字孪生、数字人、云桌面、云手机、云游戏、云渲染、工业软件等多领域应用。
沐曦集成电路
沐曦成立于2020年,致力于为异构计算提供全栈GPU芯片及解决方案,产品可广泛应用于人工智能、智慧城市、数据中心、云计算、自动驾驶、数字孪生、元宇宙等领域。
其中全栈GPU芯片产品包括用于AI推理的MXN系列GPU(曦思),用于AI训练及通用计算的MXC系列GPU(曦云),以及用于图形渲染的MXG系列GPU(曦彩)。此外,沐曦产品均采用完全自主研发的GPU IP,拥有完全自主知识产权的指令集和架构,配以兼容主流GPU生态的完整软件栈(MACAMACA),具备高能效和高通用性的特点。
芯动科技
芯动科技成立于2006年,是一站式IP和芯片定制企业,聚焦计算、存储、连接等三大赛道,提供跨全球各大工艺厂从55纳米到5纳米全套高速混合电路IP核和IP相关芯片定制解决方案。
GPU产品上,芯动科技推出了芯动风华系列GPU,主要瞄准渲染商用市场,是目前国内支持框架多、延展性强的高性能GPU产品系列,在图形渲染和智能计算领域具备高安全性、高可靠性、高性能、低功耗、强兼容性,可广泛运用于桌面、智能座舱、元宇宙数字人、工控机嵌入式、笔记本、服务器等多个领域。
芯瞳半导体
芯瞳半导体成立于2019年12月,主要业务包括GPU芯片设计、异构计算平台方案、嵌入式显示系统解决方案、GPU应用部署解决方案。公司GPU架构采用了业界主流的统一渲染架构,并具有高度可扩展的互联结构和计算阵列。
2023年,芯瞳GB2062正式对外发布,这是芯瞳半导体推出的第二代自主研发高性能图形处理器芯片。该芯片采用12nm CMOS工艺,具有自主设计、更强功能、更低功耗等特点,可广泛适用于三维图形领域(CAD、GIS、动画模型、电脑游戏等)和通用计算(GPGPU)领域。
智绘微电子
智绘微电子成立于2018年12月,专注于国产自主可控创新型GPU芯片设计的细分领域,致力于发展高性能计算机系统所需的图形渲染、图像处理、虚拟现实、人工智能等通用处理器芯片。
智绘微电子2020年10月推出了第一代高性能桌面级显卡GPU IDM919,适配麒麟、统信多个国产操作系统,以及龙芯等多个国产CPU,性能达到当时国内领先水平。第二代GPU芯片IDM929基于自主可堆叠微内核架构、自主IDMV指令集和IDMV编译器研发,适用于桌面办公、图形工作站、图像处理等领域,完美兼容国产化生态,与飞腾信息的腾锐D2000处理器完成兼容性适配认证。
格兰菲
格兰菲成立于2020年12月,研发团队拥有图形图像以及AMOLED显示驱动两大产品的全部核心技术,并掌握独立于欧美的图形图像产品架构,具备完全自主知识产权。
Arise-GT10C0是格兰菲为桌面、商业显示以及通用计算等中高端应用场景,研发设计的第一款图形和图像独显芯片。它基于28nm工艺制造,内置完全独立自主研发的新一代图形图像处理引擎,兼容银河麒麟KOS、统信软件UOS、Windows等主流操作系统,同时可在X86、ARM、MIPS等主流硬件平台操作运行,支持多种图形和图像的API接口标准,例如:DirectX11、OpenGL4.5、OpenCL1.2等。
砺算科技
砺算科技成立于2021年,坚持自研架构、自主知识产权,正在打造对标国际主流产品的国产GPU芯片。其G100图形渲染芯片产品目前已完成市场规格定义、架构设计、SIC设计、模级和及芯片级验证、软件仿真、硬件仿真,以及大部分后端设计,目前正在进行流片前的准备工作。根据G100产品的设计标准,该产品对标目前市场的中高端显卡,根据前期仿真测试的结果,可以支持当下流行的3A游戏大作。
为梳理信创产业上下游相关企业的分布情况,掌握相关产品及服务的市场现状,洞察产业发展现状及未来发展趋势,物联传媒启动“国产信创AIoT产业图谱”梳理,收录信创产业链上下游AIoT企业,展示从基础硬件、软件到应用服务的信创全链条布局,一起见证信创产业国产替代的蓬勃发展。
注:图谱持续更新中,如有更多相关领域未提及的企业,请扫描图谱上方二维码联系工作人员。在收到企业资料后,我们将展示于后续更新的信创专题文章以供参考。
热门跟贴