GPU是一个硬骨头,没有很大的决心和推动力,很难做好。

出品丨自主可控新鲜事

转载请注明出处

正文共4737,建议阅读时间10分钟

芯片创业,九死一生”,其实死亡早已拉开序幕。

过去一年,不少芯片企业负面消息满天飞,裁员、解散消息不断,更有不少破产清算的企业在无人的角落悄悄消失——钛媒体援引企查查的数据显示,2023年,中国已经有1.09万家芯片相关企业工商注销、吊销,这意味着平均每天近30家芯片企业消失 。多吗?其实不算多。 海水的另一半是火焰,反观新注册的芯片相关企业,2023年共有6.57万家,同比增加9.5%。

大把的钱、大批大批的公司在往芯片领域冲。但这个行业因此兴旺了吗?

好像也没有,毕竟能经历“设计-研发-流片”进入市场且盈利的头部芯片企业只是少数。

近日,一则有关“国产GPU砺算科技濒临破产的消息在业内不胫而走。

有传言称,该公司早在去年6月就出现了欠薪问题,并且到现在都没有彻底解决,因此不得不准备筹措数亿元资金,用于缓解财务压力。

而在2022年,仅仅成立一年的砺算科技先后宣布完成数亿元天使轮和Pre A轮融资,有着“国内GPU创业热潮中最年轻的生力军之一”的光环,目标是走 自研架构自有IP路线,真正掌握整体芯片设计。

两相对比下,不禁让人唏嘘。而砺算科技急转直下濒临破产背后折射的是GPU芯片赛道竞争加剧的现状。

01 被迫变卖4成股权“续命”

根据官网介绍,砺算科技是一家致力于研发多层次(可扩展)图形渲染GPU的公司, 公司三位创始人均曾在老牌硅谷GPU公司S3沉淀了深厚的技术能力及工程经验。 1984年,孔德海考入清华大学无线电系本科专业,从1992年起从事GPU芯片研发,是中国第一代超大规模集成电路设计师;宣以方,拥有28年GPU研发经验,曾领导量产15代GPU芯片;砺算科技CTO牛一心在1994年加入S3,是首个S3D引擎的研发者,也是全球第一代3D加速GPU芯片ViRGE(总销售超1亿颗)的负责人。在嗅到市场需求后,三位芯片老兵一拍即合,回到国内打造真正自主研发的GPU。

“GPU是一个硬骨头,没有很大的决心和推动力,很难去做好这个事情。”

GPU的系统设计复杂而庞大,技术涉及面广,想要从零打造完全自主的GPU芯片并非易事。砺算科技创始团队已深耕GPU数十年,积累了方法论、顶层设计、最优化调度、高运算单元利用率等诸多工程经验,能兼顾大芯片量产对设计实力、know-how和经验传承的要求。

自2021年8月成立以来,砺算科技始终坚持自研架构、自主知识产权,旨在打造对标国际主流产品的国产GPU芯片,满足国内2000亿渲染GPU全方位市场。截至目前,砺算科技已完成天使轮和Pre-A轮累计3亿元的融资并且在南京、北京、上海等地均设有分公司。

(砺算科技自有知识产权GPU产品:天图TrueGPU™)

据了解,砺算科技的第一代高性能GPU产品G100,采用6nm工艺生产(曾扬言要将国内第一颗6nm GPU推向市场,性能对标英伟达在国内销量最大、占比达90%的主流产品(10-20TFLOPS)。

和市面上现有产品不同的是,砺算科技会提供定制化服务。在功能设计、算法优化、渲染性能等方面,砺算科技会针对国内新市场和应用需要,进行定制化设计,满足国内合作伙伴的需要,如提供定制的功能,帮助客户降低成本,也为合作伙伴第一时间采用砺算第一代GPU产品并快速量产提供了保障。

然而,尽管融资数亿,并且还有创始人团队履历及投资人名单的光环加持,这家昔日明星公司仍然难抵GPU赛道“烧钱”属性。在高昂运营成本的压力下,砺算科技很快就传出了运营困难、员工薪资缓发、产品流片不利等负面消息。

现如今,砺算科技为了“自救”,计划变卖上海分公司、40%的股权,用于解决产品流片和偿还欠薪等问题。

02 谁是砺算科技接盘侠?

好消息是,东芯股份作为存储芯片行业的领军者,日前宣布拟跨界收购砺算科技40%的股权,投资金额预计不超过2亿元。一方面,将通过对外投资的方式切入国产GPU赛道;另一方面,将帮助砺算科技渡过难关。

东芯股份在公告中表示,关于投资(砺算科技)目的,系为进一步提升公司核心竞争力和持续发展能力,有利于公司丰富产品线,拓展新的应用场景,提升公司的市场空间,增强公司的市场竞争力和可持续发展能力,有助于进一步提高上市公司资产质量,符合公司发展战略。

但坏消息是,这一收购计划见光后,东芯股份却迎来了股价大跌。随后,东芯股份在5月12日晚间披露的补充公告中又透露了更多信息。

公告称,上海砺算的G100图形渲染芯片产品目前已完成市场规格定义、架构设计、ASIC设计、模级和及芯片级验证、软件仿真、硬件仿真,以及大部分后端设计,目前正在进行接口IP集成以及最终验证。以上研发工作完成后,将可以交由代工厂进行流片,后续还需进行封测、功能和性能测试、送样、验证等阶段。

与此同时,东芯股份还在补充公告中提示风险称,上海砺算的芯片设计研发需要经历技术论证、不断的研发攻关及验证、流片及测试、客户与平台的验证及导入等一系列环节,技术壁垒高、研发投入大、研发周期长,研发是否成功存在不确定性。另外,研发成功后的产品仍需经过市场营销、客户开拓等市场化阶段。如标的公司(指砺算科技)最终不能成功研发出契合市场需求且具备成本优势的产品,可能导致标的公司竞争力下降,影响标的公司后续发展,存在公司的投资不能收回的风险。

因此,东芯股份强调,此项投资目前尚未正式签署投资协议和意向性协议,尚处于筹划阶段,最终的投资金额和股权比例尚未确定,具体的投资方案仍需进一步研究论证和沟通协商。本次拟对外投资事项能否最终完成存在不确定性。

(图片来源:砺算科技官网)

据了解,砺算科技原本计划筹措数亿元资金,其中2亿元将用于产品流片和偿还欠薪,剩余资金将用于公司的日常运营。可如今看来,东芯股份仅公告了不到2亿元的投资计划。这意味着,即便日后双方能够达成收购协议,砺算科技也得再寻求其他办法来为公司续命。

03 GPU竞争加剧,国产市场巨大

由于历史的原因,我国在信息技术领域长期处于模仿和引进的地位。国际巨头占据了大量的市场份额,也垄断了国内的信息基础设施。它们制定了国内IT底层技术标准,并控制了整个信息产业生态。随着中国国力的不断崛起,某些国家主动挑起贸易和科技领域的摩擦,试图打压中国的和平发展。作为国民经济底层支持的信息技术领域,自然而然地成为他们的重点打击对象。面对日益增加的安全风险,必须实现自主可控,“信创”就此被正式提出。

2022年,美国当局禁止英伟达向中国出口高性能GPU芯片(A100、H100),到2023年10月,除了原来禁售的A100、H100之外,阉割版的A800、H8009、L40、L40S、甚至普通桌面端显卡RTX4090都在禁售之列。

近年来国内新建设的数据中心、智算中心都已经逐步采用国产芯片设计,为国内企业创造了巨大的市场空间。因此,相关赛道近年来涌入了很多国内参与者,竞争加剧。随着部分企业研发和市场开发不及预期,融资资金逐渐烧完,开始逐步被收购并购,甚至破产。但危与机同在,由信创和美国禁令带动为国内市场创造的巨大的市场空间将在未来行业竞争中,逐渐决出头部企业。

附:国产GPU主要参与者

华为海思

昇腾代表业界最强AI算力。昇腾系列——面向“端、边、云”全栈全场景AI芯片,代表着业界最强AI算力,采用华为自研的达芬奇架构,对标国际巨头谷歌英伟达。2018年,华为提出了全栈全场景AI解决方案并发布了两款AI芯片,昇腾910和昇腾310,其计算核心采用华为自研的面向AI计算特征的“达芬奇架构”。昇腾910是单芯片计算密度最大的芯片,对标英伟达V100和谷歌TPUv3,比V100的标称算力125TOPS高出约一倍,而昇腾310芯片的最大功耗仅8W,是极致高效计算低功耗AI芯片。基于昇腾系列AI处理器,华为推出Atlas全系列、全息感知产品,覆盖端侧、边缘侧和数据中心侧。

寒武纪

AI芯片独角兽,中国ASIC路线先行者。寒武纪成立于2016年,是全球AI芯片领域第一个独角兽初创公司,研发团队成员主要来自于中科院,董事长陈天石曾任中科院计算所研究员。作为AI芯片领域的独角兽,寒武纪曾与华为携手打造全球首款手机AI芯片,近年来通过专注打造云端产品线构建技术壁垒。

地平线

国内车载芯片领头羊。地平线成立于2015年,是一家注重软硬件结合的AI创业公司,致力于开发边缘AI芯片及相关解决方案,由Intel、嘉实资本、高瓴资本领投。

提出嵌入式AI芯片架构BPU,坚持“芯片+算法+工具链”完整解决方案。2017年12月,地平线自主设计研发了中国首款嵌入式人工智能视觉芯片——旭日系列和征程系列,基于自研BPU架构,通过软硬结合打造极致性能。目前,地平线是业界唯一能够提供覆盖从L2到L4全场景整车智能芯片方案的人工智能平台型企业。

海光信息

海光信息基于通用GPGPU架构,推出深度计算处理器DCU,其DCU协处理器全面兼容ROCm GPU计算生态。

据悉,ROCm和CUDA在生态、编程环境等方面高度相似,CUDA用户可以以较低代价快速迁移至ROCm平台,因此ROCm也被称为“类CUDA”,主要部署在服务器集群或数据中心,为应用程序提供高性能、高能效比的算力,支撑高复杂度和高吞吐量的数据处理任务。

目前公司的系列产品“深算一号”已经实现商业化应用,主要应用于大数据处理、人工智能、商业计算等应用领域。海光DCU系列产品已于2021年实现商业化应用。

燧原科技(腾讯系)

燧原科技成立于2018年,公司创始人赵立东曾任紫光通信科技集团有限公司副总裁、AMD计算事业部高级总监;COO张亚林曾任AMD资深芯片经理、技术总监。

邃思2.0是迄今中国最大的AI计算芯片。公司成立以来,已相继推出云端AI训练芯片邃思1.0/2.0、云端AI训练加速卡云燧T1x/T2x和AI推理加速卡云燧i1x/i2x,以及配套的“驭算”软件编程平台TopsRider和“鉴算”推理加速引擎TopsInference。公司2021年在世界人工智能大会期间发布的邃思2.0是迄今中国最大的AI计算芯片。

昆仑芯(百度系)

昆仑芯成立于2011年,前身为百度智能芯片及架构部,于2021年4月完成独立融资。公司团队成员多数成员来自百度、高通、Marvell、Tesla等行业头部公司,22年完成A轮融资。

百度基于自研XPU架构,致力打造通用AI芯片,赋能互联网、工业制造、智慧金融、智慧交通等多个领域。百度从2011年开始就基于FPGA实现AI加速公司于2018年正式开始AI芯片研发并在2020年实现昆仑芯1代芯片大规模部署,2021年8月昆仑芯2代产品实现量产。

平头哥(阿里系)

平头哥成立于2018年,由阿里全资收购的中天微与达摩院芯片研发团队合并而来,公司技术团队由原中天微、高通、AMD、华为海思等拥有丰富研发经验的人员构成。

作为拥有国内公有云市场最大份额的企业,阿里自研AI芯片投入最多、决心极大,致力于云端一体化芯片和AIoT芯片产品。2019年平头哥在云栖大会上发布AI推理芯片含光800,为TSMC12nm工艺制程,采用平头哥自研架构和达摩院算法,算力相当于10个GPU,性能峰值算力达820 TOPS。含光800 AI芯片专用于云端视觉处理,可在视觉图像识别/分类/搜索、医疗影像、城市监控等领域发挥作用。

景嘉微

中国第一家GPU制造商,景嘉微2015年该公司推出了第一代GPU,称为JM5400,采用65nm CMOS工艺制造;2018年8月,景嘉微推出第二代产品JM7200,主要应用于商务台式机;2021年12月,公司推出第三代14nm高性能GPU—JH920,该芯片采用14nm工艺,支持OpenGL4.0、OpenCL 3.0、Vulkan 1.1等。关键指标上,JH920像素填充率为32G Pixels/s,FP32浮点性能为1.5Tflops,功耗为30W。

旗下全资子公司景美JM7201芯⽚和标准显卡已成为主要国产整机型号的基本配置,并在金融、电力、轨交、教育等众多⾏业实现规模应⽤。

龙芯

2022年7月19日,新一代龙芯3号系列处理器配套桥片7A2000正式发布,完成了GPU驱动、显示需求和系统配套组件的研发,可满足日常桌面办公使用需求,提高产品性价比和商业竞争力。

GPU核心频率达到400-500Mhz,基于OpenGL 2.1和OpenGL ES 2.0规范实现,集成DDR4显存控制器,显存频率达到2000Mhz-2400Mhz,最大支持16GB,典型分辨率1920X1080@60Hz 最高支持2560x1440@30Hz,glmark2性能超过300 fps,glxgears 性能超过1800 fps。

龙芯中科透露,目前已启动第二代龙芯图形处理器架构LG200系列图形处理器核的研制。

兆芯

在核显级GPU领域,兆芯2019年发布了兆芯KX-6000,其核显与S3的C645规格和性能类似,甚至连驱动都能共用,3Dmark成绩为250分左右,当时集成的是C-960 GPU。

芯动科技

2021年11月正式发布了其用于服务器和桌面应用的风华一号GPU。它率先实现5-10TFLOPS的渲染能力,率先实现图形API支持超过OpenGL 4.0等;

2022年8月,芯动科技又推出了针对于桌面市场的“风华2号”GPU,“风华2号”渲染能力突出,GPU像素填充率48GPixel/s,FP32单精度浮点性能1.5TFLOPS,AI运算(INT8)性能12.5TOPS,实测功耗4至15W,支持OpenGL4.3、DX11、Vulkan等API;
目前“风华3号”已基本完成研发,将为国内用户提供超大算力光追等酷炫性能。

天数智芯

2021年3月31日,上海天数智芯对外正式发布了7nm的天垓100芯片及天垓100加速卡,实现了国内通用GPU从0到1的突破。天数智芯其首款7nm制程的云端推理通用GPU产品“智铠100”,该芯片已于今年5月点亮,将于2022年第四季度正式发布,年底量产。

2022年5月8日,天数智芯第二款产品7nm云边推理芯片“智铠100”成功点亮,产品迭代开发和商业应用领先国内同行。

摩尔线程

在短短18个月内,就发布了全新统一系统架构MUSA和全能GPU产品“苏堤”等系列新品。

基于MUSA统一系统架构GPU苏堤,摩尔线程推出了第一代桌面级显卡MTT S60,它采用12nm制程,包含2048个MUSA核心,单精度算力最高可达6TFlops;以及面向数据中心级多功能GPU产品MTT S2000,MTT S2000采用12nm制程,使用4096个MUSA核心。

登临科技

2020年6月,登临科技Goldwasser系列产品在台积电12nm工艺上Full Mask 量产成功。包括边缘计算产品 Goldwasser UL,功率25-35W,INT8 算力 32-64TOPS;半高半长的服务器计算卡 Goldwasser L,功耗 40-70W,提供 128-256TOPS 算力;另有一种全高全长的 Goldwasser XL,输出 512TOPS 算力。

沐曦

2022年1月,沐曦首款7nm工艺的异构GPU产品启动流片,预计将于2023年初实现规模量产。

沐曦致力于为异构计算提供安全可靠的通用GPU芯片及解决方案,推出MXN系列GPU(曦思)用于AI推理,MXC系列GPU(曦云)用于AI训练,以及MXG系列GPU(曦彩)用于图形渲染,满足数据中心对“高能效”和“高通用性”的算力需求。

壁仞科技

2022年8月10日,壁仞科技就推出了首款通用GPU产品BR100系列,采用7nm制程,并创新性应用Chiplet与2.5D CoWoS封装技术,创出全球算力纪录。据透露,其16位浮点算力达到1000T以上、8位定点算力达到2000T以上,单芯片峰值算力达到PFLOPS级别,以“每秒1千万亿次的计算”算力纪录,超过了英伟达目前在售的旗舰计算产品A100 GPU的3倍,强势对标英伟达H100。

瀚博半导体

去年,瀚博半导体发布了面向云端的通用AI推理芯片SV102芯片,其特点是推理性能高(单芯片INT8峰值计算能力200TOPS,还支持FP16/BF16数据类型),延迟低,视频解码性能。支持64路1080p(解码格式支持H.264、H.265、AVS2)。

芯瞳半导体

2020年8月,芯瞳半导体第一代GPU芯片GenBu01问世。enBu01显卡平均功耗3W,为应用提供超长续航能力,满足对功耗有特殊需求的场景;满足国产操作系统2D显示、3D渲染需求,支持OpenGL 4.3图形标准、1080P高清显示、多窗口显示、具有VGA和HDMI双路显示输出接口等,集成1GB DDR3存储等。

据悉,芯瞳半导体的第二代芯片正在研发阶段,预期2023年完成市场化应用。

智绘微

2020年10月,智绘微电子成功推出第一款GPU芯片IDM919。采用高性能SIMT指令实现架构和可编程统一着色器架构,不仅可用于2D和3D图像渲染,也可以用于高性能计算等。

经过最新一轮的融资后,智绘微电子将提升旗下第二代GPU芯片IDM929流片进度和第三代GPU芯片IDM939的研发进度。

免责声明:本文系网络转载,版权归原作者所有。但因转载众多,或无法确认真正原始作者,故仅标明转载来源,如涉及作品版权问题,请与我们联系,我们将在第一时间协商版权问题或删除内容!内容为作者个人观点,并不代表本公众号赞同其观点和对其真实性负责。

点击下方标题,洞悉信创产业发展