日前,高新区企业飞腾公司联合百度和长城共同推出全国产AI计算平台解决方案,面向机器学习、视频识别、图像识别、语音识别等场景提供多样化算力支撑。全国产AI计算平台解决方案可广泛应用于智慧城市、智慧交通、智慧能源、智慧金融等相关领域,全面助力新基建。

加速部署AI生态 推动AI落地应用

人工智能是“新基建”战略部署的重要构成和核心驱动力量,将推动新一轮产业变革。随着国产处理器性能和国产AI芯片性能的不断提高,打造全国产化AI计算引擎成为大势所趋。

作为网信产业链的核心成员,飞腾全力服务“新基建”责无旁贷。飞腾非常重视人工智能的产业规划和落地牵引,与人工智能头部企业达成了深度合作,加速部署AI生态,通过开放共赢的方式构筑AI生态圈,打造新基建的计算“合力”。

目前飞腾CPU已经与国内主流的AI加速卡如百度昆仑、云天励飞、比特大陆等完成适配,同时已展开和国内外通用高端GPU显卡的适配。飞腾CPU支持PaddlePaddle(飞桨)、TensorFlow、Caffe等主流学习框架,支持训练和推理的应用,可以快捷帮助用户进行模型服务与整合。基于飞腾芯片的AI服务器生态已初具规模。

为满足更多行业客户在新基建大潮下的多样化需求,飞腾携手生态合作伙伴百度昆仑、长城日前推出了全国产AI计算平台解决方案,以降低行业客户选型门槛,推动AI快速落地应用。

全国产AI计算平台解决方案赋能多行业

全国产AI计算平台解决方案搭载飞腾CPU芯片和昆仑AI芯片,基于长城全国产AI服务器进行架构,通过docker实现对深度学习框架的管理,主要框架包括PaddlePaddle(飞桨)、PyTorch、TensorFlow、Caffe、MXnet等,同时通过 Kubernetes对芯片、加速卡、算法应用进行资源管理,建设全国产AI云平台。

在AI模型和应用场景方面,支持图像分类、目标检测、语义分析、机器翻译、情感分析、语言模型、语音合成、语音识别等功能,满足智慧金融、智能电力、智慧能源、智能制造、智慧政务、智慧交通等行业应用的AI智能需求。

全国产AI计算平台解决方案采用的长城智擎ZQ2200自主AI服务器,是一款国产自主高性能异构融合AI服务器产品,采用FT-2000+/64CPU和昆仑AI训练加速卡K200异构融合的AI计算架构实现,AI训练能力640万亿次半精度浮点算力,能效比达到360GFlops/W,可扩展支持10个AI训练卡联合并行训练。该产品具有全自主、高算力、高能效、可扩展和易开发等特点,主要应用于自然语言处理、图像识别、视频处理、语音识别、计算机视觉处理等领域的各类人工智能应用。

长城智擎ZQ2200自主AI服务器

百度昆仑AI芯片是百度自主研发、具有自主知识产权的AI通用处理器芯片,采用百度的自主XPU架构(该架构连续发表论文在Hotchips 2014/2016/2017/2020上,深受业界认可),非常适合常用的深度学习和机器学习算法的云端计算需求,并能适配诸如自然语言处理、大规模语音识别、自动驾驶、大规模推荐等多种终端场景的计算需求。百度第一代昆仑芯片采用14nm先进工艺,HBM先进内存,230Tops的性能(基础版本性能,可以升频以达到256Tops性能),512GB/s的带宽,可以同时做训练和推理,在业界具有领先的技术指标。同时,百度昆仑具备较好的软硬件开放性,能更好地适配国产服务器和国产CPU产业生态。

百度昆仑AI芯片

以下是全国产AI计算平台解决方案的系统架构:

该解决方案的系统架构主要分为四层,自底向上分别为:

系统层:基于搭载飞腾FT-2000+/64芯片和百度昆仑K100/K200加速卡、安装麒麟操作系统的长城智擎ZQ2200自主AI服务器,前期已进行了深度的驱动适配工作。飞腾新一代多路服务器的适配也已在规划设计中。

百度昆仑SDK这是百度昆仑的核心库,包含了一套神经网络算子库、linux驱动、运行时程序库和神经网络图引擎框架等。这套核心库对用户提供了灵活的可编程接口,使得百度昆仑能方便的应用于灵活多变的应用场景中。

深度学习框架和模型应用这一层包含了业界常用的深度学习框架和深度学习模型,按照应用场景划分,目前业界应用基本聚焦于CV(图像分类、目标检测)、NLP(语义分析、机器翻译、情感分析、语言模型)和语音(语音识别、语音合成)等领域。在实际应用中,通常还需要跟AI平台结合起来,实现资源虚拟化、集群管理、任务调度、多机多卡联合训练等功能。

行业解决方案在这一层主要面向垂直行业,解决客户的实际问题,通常需要整合多个深度学习应用场景,提供的是一整套完整的软硬件解决方案。目前针对智慧金融、智能电力、智慧能源、智能制造、智慧政务、智能交通等行业都可采用该AI联合解决方案。

FT-2000+/64提供核心算力支撑

全国产AI计算平台解决方案中搭载的飞腾FT-2000+/64处理器,是飞腾面向高性能服务器领域的产品,集成64个自主研发的处理器核心FTC662、主频2.0~2.3GHz,典型功耗100W。

该款处理器设计了数据亲和的多核处理器体系架构,突破了高效乱序超标量流水线、层次化片上并行存储结构、多级异构片上互连网络、高可用处理器设计等关键技术,实测性能达到了国际主流服务器CPU同等水平,填补了国产高端通用CPU领域的空白,是中国首款自主设计的64核通用CPU,也是国际上首款兼容ARMv8指令集的64核通用CPU,为百度昆仑AI芯片提供了高效完整的AI计算流程支撑。

随着新基建的加速推进,AI算力需求将逐步迈入高峰期,更高性能的AI服务器将迎来高速增长。根据IDC预测,中国AI服务器市场在2018-2023年的年复合增长率为37.9%,到2023年AI服务器市场规模将达到2019年的3.6倍。

全国产AI计算平台解决方案聚合CPU通用计算算力和AI算力,开启了国产算力新时代,将为众多合作伙伴赋能,驱动多样化行业应用,成为“新基建”大潮中市场的全新选择。

来源:飞腾PHYTIUM,转载请注明出处