强强联手！飞腾与百度、长城合作开启国产算力新时代，赋能新基建！|服务器|百度|算力

日前，高新区企业飞腾公司联合百度和长城共同推出全国产AI计算平台解决方案，面向机器学习、视频识别、图像识别、语音识别等场景提供多样化算力支撑。全国产AI计算平台解决方案可广泛应用于智慧城市、智慧交通、智慧能源、智慧金融等相关领域，全面助力新基建。

加速部署AI生态推动AI落地应用

人工智能是“新基建”战略部署的重要构成和核心驱动力量，将推动新一轮产业变革。随着国产处理器性能和国产AI芯片性能的不断提高，打造全国产化AI计算引擎成为大势所趋。

作为网信产业链的核心成员，飞腾全力服务“新基建”责无旁贷。飞腾非常重视人工智能的产业规划和落地牵引，与人工智能头部企业达成了深度合作，加速部署AI生态，通过开放共赢的方式构筑AI生态圈，打造新基建的计算“合力”。

目前飞腾CPU已经与国内主流的AI加速卡如百度昆仑、云天励飞、比特大陆等完成适配，同时已展开和国内外通用高端GPU显卡的适配。飞腾CPU支持PaddlePaddle（飞桨）、TensorFlow、Caffe等主流学习框架，支持训练和推理的应用，可以快捷帮助用户进行模型服务与整合。基于飞腾芯片的AI服务器生态已初具规模。

为满足更多行业客户在新基建大潮下的多样化需求，飞腾携手生态合作伙伴百度昆仑、长城日前推出了全国产AI计算平台解决方案，以降低行业客户选型门槛，推动AI快速落地应用。

全国产AI计算平台解决方案赋能多行业

全国产AI计算平台解决方案搭载飞腾CPU芯片和昆仑AI芯片，基于长城全国产AI服务器进行架构，通过docker实现对深度学习框架的管理，主要框架包括PaddlePaddle（飞桨）、PyTorch、TensorFlow、Caffe、MXnet等，同时通过 Kubernetes对芯片、加速卡、算法应用进行资源管理，建设全国产AI云平台。

在AI模型和应用场景方面，支持图像分类、目标检测、语义分析、机器翻译、情感分析、语言模型、语音合成、语音识别等功能，满足智慧金融、智能电力、智慧能源、智能制造、智慧政务、智慧交通等行业应用的AI智能需求。

全国产AI计算平台解决方案采用的长城智擎ZQ2200自主AI服务器，是一款国产自主高性能异构融合AI服务器产品，采用FT-2000+/64CPU和昆仑AI训练加速卡K200异构融合的AI计算架构实现，AI训练能力640万亿次半精度浮点算力，能效比达到360GFlops/W，可扩展支持10个AI训练卡联合并行训练。该产品具有全自主、高算力、高能效、可扩展和易开发等特点，主要应用于自然语言处理、图像识别、视频处理、语音识别、计算机视觉处理等领域的各类人工智能应用。

长城智擎ZQ2200自主AI服务器

百度昆仑AI芯片是百度自主研发、具有自主知识产权的AI通用处理器芯片，采用百度的自主XPU架构（该架构连续发表论文在Hotchips 2014/2016/2017/2020上，深受业界认可），非常适合常用的深度学习和机器学习算法的云端计算需求，并能适配诸如自然语言处理、大规模语音识别、自动驾驶、大规模推荐等多种终端场景的计算需求。百度第一代昆仑芯片采用14nm先进工艺，HBM先进内存，230Tops的性能（基础版本性能，可以升频以达到256Tops性能），512GB/s的带宽，可以同时做训练和推理，在业界具有领先的技术指标。同时，百度昆仑具备较好的软硬件开放性，能更好地适配国产服务器和国产CPU产业生态。

百度昆仑AI芯片

以下是全国产AI计算平台解决方案的系统架构：

该解决方案的系统架构主要分为四层，自底向上分别为：

系统层：基于搭载飞腾FT-2000+/64芯片和百度昆仑K100/K200加速卡、安装麒麟操作系统的长城智擎ZQ2200自主AI服务器，前期已进行了深度的驱动适配工作。飞腾新一代多路服务器的适配也已在规划设计中。

百度昆仑SDK：这是百度昆仑的核心库，包含了一套神经网络算子库、linux驱动、运行时程序库和神经网络图引擎框架等。这套核心库对用户提供了灵活的可编程接口，使得百度昆仑能方便的应用于灵活多变的应用场景中。

深度学习框架和模型应用：这一层包含了业界常用的深度学习框架和深度学习模型，按照应用场景划分，目前业界应用基本聚焦于CV（图像分类、目标检测）、NLP（语义分析、机器翻译、情感分析、语言模型）和语音（语音识别、语音合成）等领域。在实际应用中，通常还需要跟AI平台结合起来，实现资源虚拟化、集群管理、任务调度、多机多卡联合训练等功能。

行业解决方案：在这一层主要面向垂直行业，解决客户的实际问题，通常需要整合多个深度学习应用场景，提供的是一整套完整的软硬件解决方案。目前针对智慧金融、智能电力、智慧能源、智能制造、智慧政务、智能交通等行业都可采用该AI联合解决方案。

FT-2000+/64提供核心算力支撑

全国产AI计算平台解决方案中搭载的飞腾FT-2000+/64处理器，是飞腾面向高性能服务器领域的产品，集成64个自主研发的处理器核心FTC662、主频2.0~2.3GHz，典型功耗100W。

该款处理器设计了数据亲和的多核处理器体系架构，突破了高效乱序超标量流水线、层次化片上并行存储结构、多级异构片上互连网络、高可用处理器设计等关键技术，实测性能达到了国际主流服务器CPU同等水平，填补了国产高端通用CPU领域的空白，是中国首款自主设计的64核通用CPU，也是国际上首款兼容ARMv8指令集的64核通用CPU，为百度昆仑AI芯片提供了高效完整的AI计算流程支撑。

随着新基建的加速推进，AI算力需求将逐步迈入高峰期，更高性能的AI服务器将迎来高速增长。根据IDC预测，中国AI服务器市场在2018-2023年的年复合增长率为37.9%，到2023年AI服务器市场规模将达到2019年的3.6倍。

全国产AI计算平台解决方案聚合CPU通用计算算力和AI算力，开启了国产算力新时代，将为众多合作伙伴赋能，驱动多样化行业应用，成为“新基建”大潮中市场的全新选择。

来源：飞腾PHYTIUM，转载请注明出处