日前,开放计算标准工作委员会(OCTC)和OCP中国社区联合主办了“面向应用的服务器算效标准与评估”开放计算技术沙龙。活动汇聚了中国电子技术标准化研究院、中石油、中移动、快手、浪潮信息、AMD、Intel、海光信息等研究机构、知名企业的产学研专家和行业领袖,对不同应用下算力需求范式变化、面向应用的算力算效评估指标体系构建、提升服务器性能及能效的前沿技术等话题进行了精彩分享和激烈讨论。
智能时代计算范式改变,亟需构建面向实际应用的算力算效评价基准
智能时代,从智慧医疗、智能客服、自动驾驶到智能制造,不同行业、不同场景的人工智能应用,不仅带来了算力需求的指数级增长,也推动了算力发展范式的变革。以往,以CPU为主的时代,大家追求的是弹性、高效、性价比,然而智能时代,新兴场景带来了差异化的算力需求,传统以CPU基础性能为主的评测基准已不再适用,亟需构建面向实际应用的算力算效评价基准。
OCTC秘书长 陈海
以应用为中心,推动算力产业构建AI时代下服务器算力算效评估标准。
在AI和大模型的驱动下,算力产业从技术、产品到应用场景的变化趋快,同时,国家政策、行业及用户对能效和算效的要求亦日益攀升。这就亟需建立适用多场景的服务器算效、能效评价的标准化方案,以确保测评结果精准对接用户实际需求,为用户、行业和厂商提供客观、准确、完整的评价体系。
中国石油集团东方地球物理公司处理中心原总工程师,教授级高级工程师 赖能和
油气行业智能化转型推动算力需求多样化发展,算力性能评估需要关注服务器在不同应用中计算精度、网络架构、存储和IO系统的平衡以及能效等。
石油产业链长,从勘探开发的地震数据初至波拾取、炼油化工的生产线控制系统到智慧加油站的销售系统,拥有丰富的智能化场景。随着油气行业智能化转型的推进,应用也在从“高精尖”传统应用向新兴多应用场景拓展,算力需求从高性能计算,向高性能数据分析和ML /DL实时计算的AI算力演化,需要面向不同应用场景,针对计算精度、网络架构、存储和IO系统的平衡设计等进行服务器系统设计和应用评估,对算力供给的多元化,高能效与绿色低碳提出了更高的要求。
中移动信息技术有限公司项目经理 李圣义
以科学、系统的评估方法来选择适合业务需求的服务器
运营商行业具有应用场景多样、多算力并行的业务特征,需要科学、系统的评估方法来选择更适合业务需求的服务器,确保投资的有效性。中国移动一直对算力算效评测标准进行积极探索,通过业务场景分类、芯片性能评估、系统性能评估、系统功耗评估等一系列技术手段,对服务器算力输出能力进行综合分析,为服务器选型、设备利旧等提供衡量参考。
以系统视角全面优化,加速服务器算力算效的升级
随着技术的飞速发展和应用场景的持续拓展,对服务器的算力和算效需求正日益攀升,这不仅意味着硬件层面的升级,比如采用性能更强的处理器和更先进的存储解决方案,也涉及到软件层面的深度优化和系统设计的创新,在OCP中国社区负责人叶毓睿主持的“服务器算效提升及行业应用”圆桌讨论环节,嘉宾从技术、应用和系统等不同层面,分享了关于服务器的算效、能效提升的前沿技术思考与展望。
AMD服务器资深系统架构师周景瑜认为,面向应用,芯片计算架构的创新需关注内存、IO等诸多要素。过去20年里,标准服务器的性能基本上每2.4年会翻一倍。而GPU服务器则每2.1年性能提升一倍。服务器计算效率的持续提升主要源于三大因素:一是整机制程,从28纳米演进至当前的3纳米,芯片厂商可以在制程迭代,微架构优化、及封测方面展开合作,进一步提高每瓦特的性能;二是CXL技术,通过支持CXL 3.1打破内存墙,提高了核存比;三是IO,未来趋势是减少外部数据沟通成本,使用光纤方式传输数据来提升能效比。
赖能和表示,油气行业用户在评估服务器的性能、能效和计算效率时,需要综合考量多种因素,不应仅仅关注单台服务器或工作站的性能,而应更加重视整个系统的性能表现。同时,网络连接技术对于提升计算性能具有重要作用。随着处理器核心数量的不断增加,算力大幅提升,但未必对所有应用都能达到线性增加,有些并行计算,当核心数量达到一定数量后,对并行计算性能效率会有所影响,因此需要从系统架构和应用优化两个层面进行调整优化。
快手IDC系统架构师杨琪表示,针对数据中心的算力算效与能效的平衡,PUE不一定是唯一的参考标准。对用户而言,算力提升意味着能加快成果的产出,但有可能会带来更高的能耗。高算力与低能耗之间的博弈,可能影响数据中心的整体收益,需要业界更深入的探讨,比如数据中心的液冷供水温度设定,从35℃降低至25℃,低水温虽然可能带来PUE的升高,但是算效也可能提高了,这就需要进一步的综合评估对比收益是否增加。因此,将算力、算效与PUE结合纳入考量指标是未来数据中心算效评测发展的方向。
浪潮信息产品方案开发部标准认证处经理康真健也指出,仅从算力或能效的角度来看,目前的评估标准是割裂的,应该更多地考虑能效和算力产出是否经济。例如,从每消耗一度电或一定的二氧化碳排放量,社会能获得多少算力价值,来衡量高性能与低能耗之间的关系。比如SPEC组织在制定SART标准时,强调了用户实际获得的算力与消耗电力的比值,这是一个需要精确计算的重要指标。
英特尔亚太研发数据中心工程部经理沈勇表示,不同行业应用的算力需求各异,处理器也在面向应用进行不同的优化,比如英特尔的新平台一款是针对性能优化的叫性能核,另一款是考虑到客户对能效的需求,计算性能到一定程度之后更关注能效,提供面向能效优化的叫能效核。未来随着核心数的增长,如何发挥最大性能,同时平衡性能与能效会面临很大挑战,对软件、生态提出更高的要求,全产业链合作将成为关键。
智能时代的到来推动了算力范式的深刻变革,不同行业对服务器算效的需求愈发多样化和复杂化。在此次沙龙中,产业界对算效评估标准化高度关注,OCTC也正式公布了面向多样化应用场景的《服务器算力算效评价规范》。该规范面向大数据、人工智能等应用场景,由中国电子工业标准化技术协会牵头,业界芯片厂商、系统厂商及数据中心用户等联合参与编制,评测方案、评测工具和标准细则正在制定中。
OCTC热忱欢迎更多机构及产业链上下游从业者积极参与,以确保规范的完善性和适用性,构建开放、公平的服务器算力评估基准,推动算力产业的快速发展。
热门跟贴