AMD自上代Zen 4开始支持AVX-512指令集,但那是使用256位SIMD用两个时钟周期来执行AVX-512指令的,而Zen 5则可提供完整的512位数据位宽,根据我们首发测试,锐龙9 9950X的AVX-512计算性能几乎是锐龙9 7950X的两倍。当然了AVX-512指令在日常的应用范围偏窄,但它确实可以显著提高多种工作负载的性能,但在以往的认知中,调用AVX-512指令会让CPU功耗大增并让工作频率下降。
根据InstLatX64的测试,采用Zen 5架构的AMD锐龙9000系列处理器在AVX-512负载中并不会出现频率大幅度下降和功率大增的情况,锐龙9 9950X在使用AVX-512负载时,CPU主频会从5700MHz降低至5300MHz,大概降低了10%,而在Intel旧的Skylake-X上使用AVX-512通常会导致频率大幅下降,当然这情况在Rocket Lake以及Ice Lake之后的处理器上就不在出现了,甚至在12代酷睿之后的消费级产品AVX-512甚至都没了。
AMD Zen 5架构处理器有四个用于AVX-512的全宽512位执行单元,而旧的Zen 4架构则使用两个AVX-256单元来执行512位指令,这使得Zen 5执行这类指令非常高效,但这设计确实增大了芯片面积。此外,款数据路径本身就很耗电,因此锐龙9000处理器在执行AVX-512指令时会消耗多多少电还有待观察。
对于高性能台式机、工作站和服务器通常用于处理器来自AI和HPC领域的各种矢量工作负载,因此AMD设计用于台式机和服务器的Zen 5架构时,完整的AVX-512算力非常重要,但对于移动处理器来说就不是这样了,tomshardware表示用与移动处理器的Strix Point其实和Zen 4一样用两个AVX-256单元来执行AVX-512指令。
虽然同是Zen 5架构但使用两种不同的方法实现AVX-512可能会让开发者和用户感到困惑,但AMD通过这样的设计让Strix Point核心变得更加紧凑,从而可塞下更多的核心,而更多的核心可为用户带来更高的AVX-512性能。
热门跟贴