近年来,在服务器和数据中心等企业级市场,AMD凭借持续更新的“Zen”架构,其EPYC(霄龙)系列处理器的市场占有率上升势头非常迅猛。2022年11月,AMD推出全新第四代EPYC处理器。新处理器将单插槽处理器核心数量提升到最多96核,并且采用了最新的“Zen 4”架构,带来大量全新特性。接下来,本文就对第四代EPYC处理器进行详细解读。

CXL 1.1+:提供超大规模的内存寻址空间

在互联技术特性上,EPYC 9004对CLX 1.1+的支持是一个亮点。本刊之前介绍过有关CXL的技术内容,CXL的全称是Compute eXpress Link,它是一个开放的行业标准,主要用于在CPU和加速单元(GPU、DPU)或者一些IO设备之间提供高速缓存一致性互联,同时允许CPU在连接设备的相同内存区域上工作,从而提高性能和电源效率,并降低软件复杂性,减少数据移动次数。该规范以PCIe 5.0作为技术基础,最新修订版本的CXL 3.0则以PCIe 6.0作为技术基础。

CXL规范的推出速度非常快,在CXL 1.0技术还未准备好之前,CXL 2.0技术就已经到来,新规范要求在总线的SerDes级别提供内置支持,从而实现和远程内存组的低延迟连接。因此,AMD不得不在新处理器的设计后期重新设计了CXL部分功能,还融入了包括持久内存和RAS报告等功能,但是其余部分则不能全部支持,因此AMD称之为CXL 1.1+。目前AMD的CXL总线基于PCIe 5.0规范,和PCIe 5.0共用物理接口。

打开网易新闻 查看精彩图片

▲ AMD的CXL 1.1+只支持第三类,也就是内存扩展。

CXL支持三类设备,第一种常用于网卡这类高速缓存设备,第二种常见于GPU、AI等应用的内存加速器,第三种是内存扩展控制器,通常作为内存缓冲器,常用作内存带宽或是容量的扩展。EPYC 9004目前只支持第三种方案,允许用户将远程内存作为本地内存进行寻址,并且允许将多个CLX Type-C设备聚合成一个交错的NUMA节点,还支持“headless NUMA”节点。其他功能包括能够优化本地内存和CXL内存之间延迟差异的QoS机制,支持AMD的SEV-SNP密钥扩展和AES-256-XTS等功能。

AMD目前最多允许将64个PCIe 5.0通道分配给CXL 1.1+,单个CXL 1.1+允许最多16个通道,因此单个CXL 1.1总线带宽为双向128GB/s。如果启用全部64个通道的话,带宽会高达双向512GB/s,这已经高出了12通道DDR5内存的460GB/s了。考虑到EPYC 9004高达96个CPU核心对内存带宽的需求,这正是AMD支持CXL 1.1+的意义所在。

性能预览:轻松抛离竞争对手

在架构介绍部分,AMD提及了不少性能方面的信息,不过最终还得看综合性能情况。AMD选择了英特尔第三代至强可扩展处理器,也就是Ice Lake-X架构的产品进行对比。

打开网易新闻 查看精彩图片

▲ EPYC 9004在云端方面的性能大幅度领先

打开网易新闻 查看精彩图片

▲AMD宣称EPYC 9004在多项性能中领先

首先来看单核心性能。AMD使用了16、32、40/48核心的处理器进行对比。EPYC 9004系列的不同型号处理器在整数、浮点性能方面超越英特尔产品最多可达55%、96%。虚拟化性能方面,EPYC 7003的表现就足以抗衡英特尔产品,EPYC 9004的性能更是英特尔产品的2.8倍之多。在FSI模拟、3D渲染和商务(MySQL业务查询)方面,EPYC 9654的性能分别是英特尔至强铂金8380的大约2.1倍、2.4倍和2.7倍。HPC性能方面就更不用多说了,2P配置的EPYC 9654在天气预报、计算流体和有限元分析方面分别是2P配置的英特尔至强铂金8380的大约2.5倍、2.5倍和2.6倍。HPC单核心性能方面,同样是这三项测试,32核心的EPYC 9374F性能是同为32核心的至强铂金8362的2倍、1.7倍和1.7倍。

打开网易新闻 查看精彩图片

▲EPYC 9004系列不同型号处理器的单核心整数性能都大幅领先对手

打开网易新闻 查看精彩图片

▲EPYC 9004系列不同型号处理器的单核心浮点性能同样大幅领先

打开网易新闻 查看精彩图片

▲HPC性能方面,EPYC 9004实现了对英特尔处理器的碾压态势。

此外,AMD还评估了空间和电能需求。在同时处理1995个虚拟化需求的时候,2P的EPYC 9654处理器只需要5台服务器即可完成,与之对应的英特尔至强铂金8380则需要15台服务器,AMD节约了67%的机架数量、52%的电能消耗(相当于34英亩森林所释放的二氧化碳值),降低了40%的1年服务TCO。

打开网易新闻 查看精彩图片

▲AMD还评估了空间和电能需求,EPYC 9004系列更是大获全胜。

在同样性能的情况下,比如在SPECreat 2017整数基准测试中同样获得8500分,AMD只需要1P EPYC 9654的处理器使用10台服务器即可,英特尔则需要2P的至强铂金8380的处理器使用15台服务器,这意味着AMD节约了67%的处理器数量、20%的核心数量、50%的能源消耗和46%的1年服务TCO。

AMD还展示了EPYC处理器在产业环境方面的情况。目前已经有数百家企业使用或者正准备使用AMD的产品,同时媒体和内容、制造业、5G和金融服务等行业都在使用AMD EPYC产品持续创造价值。历经四代进化,AMD EPYC终于开创了一个非常不错的产业环境,并正在逐渐拓展自己的市场范围。

总结:强大的产品无须多言

从已知的信息和规格来看,EPYC 9004系列处理器代表了当前最先进、最强大的计算性能,无论是架构设计还是产品性能都没有什么可挑剔的地方。

打开网易新闻 查看精彩图片

▲EPYC 9004的晶元结构示意图,不同的部分清晰可见。

打开网易新闻 查看精彩图片

▲AMD EPYC产品路线图一览

AMD还给出了EPYC未来的产品路线图。目前AMD发布的EPYC 9004系列是代号为“Genoa”的产品。接下来,AMD还将陆续推出采用3D V-Cache技术的“Genoa-X”,面向云计算服务的“Bergamo”(贝尔加莫),以及面向电信基础设施和边缘计算的“Siena”(锡耶纳)。在2023年~2024年,AMD将推出全新设计的Zen 5架构以及第五代EPYC处理器家族,代号“Turin”(图灵)。AMD在前三代EPYC大获成功之后,已经开始计划利用EPYC进入更多市场,继续和英特尔等厂商展开正面厮杀。这样的竞争态势,显示出AMD强大的进取心。就像全新进化的AMD新品牌平台 “同超越,共成就 _”(“together we advance_”),持续进步的AMD还会带给我们怎样的惊喜呢?一起期待吧!jon_chen@finehoo.com

来源:MC评测室

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片