记者 | 彭新

9月初,随着美国限制对中国出口高性能数据中心GPU,加速计算国产化趋势渐明,国内芯片企业正趁势发展,带动AI芯片、GPU市场热度。在资本市场上,中国相关概念股应声上涨。

“在AI芯片领域,天时地利人和,包括国家政策、人才和经验等等,这是很好的机会。”近日,燧原科技创始人兼CEO赵立东接受界面新闻记者采访时称,把握上述机会的关键是打破生态垄断,实现架构创新。

燧原科技于2018年3月注册成立,在种子轮之后对外公布了四轮融资,且四轮均有腾讯参投,累计融资额近40亿元人民币。在产品上较早实现了AI芯片的产品化,产品体系覆盖云端的人工智能训练、推理芯片及其加速卡、人工智能训练OAM模组,是国内早期同时拥有云端训练、云端推理解决方案的AI芯片初创公司。在9月初的世界人工智能大会上(WAIC),燧原科技发布“云燧智算机”人工智能加速集群产品,进入集群计算领域。

燧原科技的创始团队来自AMD。赵立东曾担任紫光集团副总裁,更早前在AMD工作了7年时间,任计算事业部高级总监等。另一位创始人兼COO张亚林曾任职AMD上海研发中心,担任多个芯片项目研发负责人。

团队建制完整是投资人看好燧原的重要原因,创始人外,燧原相当一部分高端人才也来自AMD。“AMD一度有三分之一的全球收入来自中国,而中国有完整的建制研发体系,独缺产品定义权。”赵立东解释,所谓产品定义,即协调各个部门确定芯片产品,定义规格,做好竞争分析,明确市场前景。这一重要工作一直由AMD德州奥斯丁总部承担。

在AMD的经历和创始团队的芯片开发经验,成为燧原成立的契机和基础。从产品和团队规模而言,近四年时间里,燧原从不足十几个人发展到八百人,产品从单一的训练芯片发展为端到端方案,最终又涉足更复杂的集群计算。

赵立东表示,燧原看到的机会是:逐渐增长的AI计算需求下,传统的CPU(中央处理器)已不能满足算力的需求,GPU(图形处理器)凭借并行计算能力一跃成为最佳选择。而英伟达为GPU构建的数学、算子、函数库等完整软件生态,让GPU成为AI计算无可争议的主角。

AI计算大致分为两个层面,首先是对模型进行训练,整个过程可能耗时数天;之后是训练出的模型响应实际请求,如对一张图片进行识别,做出推理。从架构而言,英伟达的传统GPU约60%的面积用于通用计算,30%用于图形渲染,主要是加速计算的GPGPU(通用计算GPU)普遍去掉图形渲染部分。过去十多年,英伟达捕捉到AI技术崛起的浪潮,通过CUDA平台搭建的软件生态,使其GPU成为全球数据中心处理AI应用的标配,占据了超过90%的市场份额。在云端领域,目前英伟达旗下的GPU占据训练市场不少份额,部分推理任务则由英特尔CPU承担 。

业界普遍认为,训练芯片的研发难度和商业化落地更难,原因是在AI训练的过程中,神经网络模型并没有固定,所以对芯片的通用性有很高的需求,英伟达的GPU长期为第一选择。而推理则更简单,增速更快,故而训练芯片对于芯片公司的设计能力考验更高。从全球AI芯片市场来看,先推理后训练是主流路径,英特尔收购的AI芯片公司Habana、国内诸多AI初创公司也是如此。

以此来看,燧原科技先推训练芯片、后发推理芯片的路线颇为特别。

2019年12月,燧原科技发布第一款云端训练芯片“邃思”,并以此芯片衍生出训练和推理两款衍生计算卡。“不仅做大芯片而且是做人工智能训练芯片,它比推理要复杂很多。训练芯片可以做推理,但推理芯片不能做训练。”赵立东称。随后燧原又推出第二代训练芯片邃思2.0和推理芯片邃思2.5,共计三款芯片。

实际上,在AI计算领域,由于受到诸多云巨头和初创公司的冲击,英伟达一家独大的格局有望被改变。

特别是在中国,强势的英伟达并非没有“弱点”:绝大部分AI厂商依赖英伟达软硬件生态,议价能力不足;另一方面,基于英伟达非开源软件开发AI功能,难以进行更深度开发。而客户支持、服务团队方面,英伟达很难将BAT等中国客户与美国谷歌、亚马逊等美国公司等同视之。

也因此,有必要建设自有芯片生态供应链。据赵立东介绍,燧原选择自建开发工具链,适配自家硬件。不过,目前绝大多数专攻AI领域的国产芯片厂商依赖或兼容英伟达的CUDA软件生态,从而在起步阶段避开了英伟达的软件生态壁垒,赵立东认为,从软硬件一体的角度很难去评价这一做法,芯片在兼容CUDA生态基础上超越英伟达GPU可能会存在知识产权问题。

燧原科技也在尝试推进其硬件系统和软件一体化,并与机器学习算法无缝协作,比如适配谷歌的TensorFlow、Facebook的Pytorch以及百度“飞桨”等机器学习仓库中收集的算法,补全生态。所谓AI芯片生态,是指包括驱动程序、编译器、开发者工具包等软件层,以简化AI开发人员的工作。

值得注意的是,类似燧原这样的初创芯片公司,也面临着如何与大型互联网公司打交道的问题。

目前中国互联网巨头均在AI芯片领域布局,BAT也是主流云服务商,每年都会采购大量计算硬件。此前阿里半导体部门“平头哥”已经搭建了AI芯片业务,百度旗下则有AI芯片公司昆仑芯,而腾讯云曾披露三款自研芯片进展,称其中一款AI芯片已流片试产。三家中,平头哥和昆仑芯均明确会拓展外部客户。

芯片在落地过程中,成本也是企业决策的考量因素。互联网公司自研芯片,无论是从成本、开发周期,维护来看,都难以做到最好,其中一些只针对特定场景开发芯片,自用规模有限,而规模决定盈利能力,帐更难以算清,实现不了盈利就不能持续迭代。

赵立东强调,面对其他芯片公司的竞争,燧原要在芯片性价比、能耗比上做到极致。据他透露,燧原今年最主要的目标是产品规模化落地,扩大市场份额。第三代芯片产品年底会流片,预期会在第二代产品规模化基础上实现盈利。

不过,在燧原芯片产品持续迭代下,前期成本巨大,需要在规模化后进一步开源节流,提高毛利率,才能实现盈利, “(实现的)时间取决于市场环境如何,如果优先级仍然是市占率,可能要靠牺牲毛利降低价格来抢占,还要看需求,最终要多方考虑做综合判断决策。”赵立东表示。