随着人工智能技术的快速发展,AI大模型逐渐被广泛应用于各个领域。数据中心作为承载大模型的关键设施,其建设和管理面临着越来越高的要求。大模型浪潮带动了大算力需求的激增,这促使数据中心不断变革以满足多样化的智能化需求。同时,在双碳战略要求下,数据中心需要在更高效、低能耗的架构下提供更大的算力

算力全面国产化时代已提前到来

算力是数字经济运行和发展的基石和前提,算力对经济增长的拉动具有长期性和倍增效应:计算力指数平均每提高1点,数字经济和GDP将分别增长3.5‰和1.8‰,当一个国家的计算力指数达到40分、60分时,计算力指数每提升1点,其 对于GDP增长的推动力将分别增加1.5倍和3.0倍;

算力全面国产化时代已提前到来。算力的基本载体是服务器,服务器的核心部件为CPU和类GPU等计算芯片,经过多年的技术积累和市场打磨,我国国产CPU已从“可用”进入“好用”阶段,以运营商和金融为代表的大客户正有序进行信创服务器的集采和规模化应用。随着新一轮AI算力升级的浪潮的兴起以及国际局势的迅速变化,我们认为AI算力芯片的国产化时点已提前到来。

大模型是否会影响智算中心

实际上,大模型的飞速发展也将对智算中心提出更高的要求,具体来看:

第一,计算资源需求增加。随着大模型的规模不断扩大,对计算资源的需求也在不断增加。智算中心需要提供更强大的计算能力来支持大模型的训练和推理任务。

第二,存储需求增加。大模型需要大量的存储空间来存储参数、权重和中间结果。智算中心需要提供高效的存储系统来满足这些需求。

第三,数据传输和通信压力增大。大模型的训练和推理过程中会产生大量的数据,需要进行频繁的数据传输和通信。智算中心需要具备高速的网络连接和大规模的数据传输能力。

第四,能源消耗增加。大模型的训练和推理过程需要大量的计算资源,导致能源消耗的增加。智算中心需要采取节能措施,如使用高效的硬件设备和优化算法,以降低能源消耗。

第五,模型管理和调度复杂性增加。大模型的训练和推理过程需要进行复杂的模型管理和调度,包括模型版本控制、并行训练和推理等。智算中心需要提供相应的管理和调度工具来支持这些任务。

第六,安全和隐私问题突出。大模型的训练和推理过程中可能涉及敏感数据和隐私信息,需要加强安全保护措施。智算中心需要建立完善的安全机制,确保数据的安全性和隐私性。

第七,人才培养和技术更新需求增加。大模型的发展需要具备相关技术和知识的人才支持。智算中心需要加强对人才的培养和技术的更新,以适应大模型的需求。

可以说,伴随着大模型落地深入发展,智算中心需要不断提升自身的能力和技术水平,以满足大模型的需求。

提升国产AI芯片“包容力”

“如果基于国外芯片编写的软件能够很容易移植到我们的国产芯片系统上来,用户就会感觉到国产芯片好用。”郑纬民认为,但由于生态建设不完备,目前国产芯片在大模型训练相关软件移植方面表现不太顺畅,因此需要进一步加强底层研发,做好包括编程框架、并行加速、通信库在内的软件研发工作。

“为了发展AI芯片的生态体系,一些国际大企业甚至可以放弃一些高利润的项目和方案。”英博数科CEO周韡韡介绍,营造生态需要发动整个行业的创新力量,例如国际企业曾通过主动开源部分软件的底层代码、让利给基于芯片的软件开发者,形成以AI芯片为核心的算力体系。

相较于芯片本身的硬件性能提升,郑纬民认为,通过营造生态,提升国产AI芯片的“包容力”更加急迫。“如果算力生态做得非常好,即使国产芯片的硬件性能只有国外性能的60%及以上,大家也会喜欢用。”郑纬民说,但如果算力生态没做好,新型软件跑不起来、软件移植不顺畅,即便硬件性能达到国外的120%,照样难以转变为有效算力。

免责声明:

1、本号不对发布的任何信息的可用性、准确性、时效性、有效性或完整性作出声明或保证,并在此声明不承担信息可能产生的任何责任、任何后果。

2、 本号非商业、非营利性,转载的内容并不代表赞同其观点和对其真实性负责,也无意构成任何其他引导。本号不对转载或发布的任何信息存在的不准确或错误,负任何直接或间接责任。

3、本号部分资料、素材、文字、图片等来源于互联网,所有转载都已经注明来源出处。如果您发现有侵犯您的知识产权以及个人合法权益的作品,请与我们取得联系,我们会及时修改或删除。