不知不觉中AMD的锐龙处理器上市2年半了,2017年横空出世的Zen架构也发展了两代了,如今上市的是第三代锐龙——锐龙Ryzen 3000系列了,回头再看的时候发现当前的主力锐龙Ryzen 7 2700X开始陆续下架了,正如很多人不记得锐龙7 1800X处理器下架一样。

本文内容较长、而且涉及的专业名词、术语比较多,阅读也有一定的门槛,但我已经尽可能从简地解释了,对于喜欢DIY、感兴趣半导体技术的粉丝们,不妨找个安静的地方,好好地看一看,应该多少都能有点收获的。

在过去的几年中,AMD一直在研发更高性能更高能效的Zen架构,所以才有2017年锐龙处理器问世时AMD震惊世人的52% IPC性能提升,这种架构级别的提升比起大家调侃的Intel式挤牙膏升级实在太猛了,从性能到能效都是质的变化。

不过现在的两代锐龙处理器还是有一点严重不足的——单核性能不足,导致AMD一些游戏及专业应用的性能不如Intel。

从一代锐龙到二代锐龙,AMD将CPU架构从14nm Zen改进到了12nm Zen ,但这依然是小修小补,缩短了与Intel的单核差距,但没有质变,在那样的工艺及架构下已经挖掘不出更高频率的潜力了。

▍第三代锐龙用上7nm工艺:AMD CPU史上首次全面领先Intel

对CPU这种极其先进的逻辑芯片来说,任何重要的进步都离不开制程工艺的升级,14/12nm锐龙上的一些缺点,比如CPU单核频率还不够高等,AMD也不是不清楚,但他们也没办法了,GF的14/12nm工艺决定了上限了,不是想提频就提频的。

好在现在AMD上了7nm,而且代工厂从GF换到了台积电,说起来这件事也有很多波折,去年8月初GF黯然宣布无限期停止7nm及以下工艺的研发、生产,原本是准备GF、台积电两条腿走路的AMD无奈之下决定将CPU及GPU的7nm订单全部交给台积电。

对AMD来说,从原来的两家代工厂变成一家代工厂,实际上风险更大了,而且台积电之前没有过制造高性能X86处理器的经验,不过最终来看台积电财大气粗,在工艺成熟度上比GF要好得多,AMD的7nm CPU及GPU最终还是顺利量产了。

考虑到AMD这是跟14nm工艺对比的,密度、功耗的变化还不错,但25%的性能提升并不让人满意,这也可以看出摩尔定律到了10nm节点之后芯片性能的提升不那么容易了

正是因为这一点,此前有华尔街分析师称赞AMD在7nm 锐龙3000处理器上打了一个翻身仗,这是十多年来AMD首次在工艺及性能上首次全面超越Intel,绝对是历史性时刻。

▍第三代锐龙的Chiplets设计:CPU/IO核心分离 解决延迟成关键

在Zen 2架构处理器上,AMD就使用了Chiplets小芯片的设计思路,通过模块化来组合不同核心的处理器。Chiplets设计不同于以往的胶水封装,本质上是把不同工艺、不同架构的芯片电路按需搭配,比单纯的胶水封装要高明,也要复杂。

在去年推出的第一款Zen 2架构的处理器——EPYC罗马上,AMD就率先应用了这种设计方式,8组CPU核心、1组IO核心堆出了64核处理器。在锐龙3000上,桌面版不需要这么多核心,使用的2组CPU核心层、1组IO核心,最多16核32线程。

下面的IO核心整合了内存控制器、PCIe控制器等IO单元,这部分电路对性能、功耗要求没那么高,而且IO单元并不容易随着工艺微缩,所以使用的是相对低端的工艺——之前说是14nm,不过锐龙3000上的IO核心是改良版的12nm工艺。

在锐龙3000处理器上,IF总线进化到了第二代,在并行、延迟及能效上全面改进,总线位宽从256b升级到了512b以便支持PCIe 4.0,同时将Fclk与Uclk频率去耦合解锁以提高内存超频性能,并采取多种方式降低内存延迟、提高缓存速度以减少延迟带来的影响。

对于内存频率,如果追求极限低延迟,频率高了也不一定好,这也跟IF总线的工作模式有关,虽然它跟内存频率分离了,但1:1情况下延迟还是最低的,分界点就是DDR4-3733,这时候内存延迟是最低的,而AMD官方推荐的是DDR4-3600 CL16模式,对当前的内存来说这个频率、时序也很轻松能达到。

▍第三代锐龙的Zen2架构详解:一切为了更高的吞吐量

在锐龙3000中,CPU与IO核心分离之后可以有多种搭配,比如1组CPU搭配1组IO核心,这样最多是8核16线程,还有就是2组CPU核心搭配1组IO核心,这样最多16核32线程,这也是目前锐龙9 12核及16核处理器实现的根基。

在Zen 2架构中,一个chiplets芯片的总面积才74mm2,其中CCX 16MB L3缓存的核心面积才31.3mm2,同比减少了47%,一方面是因为7nm工艺的密度优势,一方面也跟Zen2的CCX只有CPU核心有关,减少了IO单元。

这里也可以解释为了降低延迟AMD为什么敢于大幅加倍L3缓存的原因了,每个CCX翻倍到16MB L3缓存后CCX核心面积依然减少一半左右,何乐而不为呢。

▍第三代锐龙的终极目标:要多核还要单核 更要能效、低温

不论是7nm工艺还是Chiplets设计,亦或者是Zen 2微内核架构,AMD在霄龙、锐龙处理器上追求的目标不外乎性能、能效,结合之前处理器表现出来的优势及槽点,具体来说就是继续保持多核性能优势、提升单核性能、提高能效、降低功耗及发热,还有就是更低的成本,不过售价这方面还跟市场有关,要看具体产品,这里先不谈了。

在7nm Zen2上,AMD总算有了突破,锐龙9 3900X 12核处理器的加速频率也达到了4.6GHz,16核的锐龙9 3950X更是达到了4.7GHz频率,而且AMD表示他们的加速频率不单单是追求单核最高频率,可能的情况下更愿意让多个核心达到加速频率,这样一来性能会更强。

①速度更快,x16双向带宽达到了32GB/s,是PCIe 3.0的两倍。

②向下兼容,PCIe 4.0也能兼容PCIe 3.0设备。

③更多连接,PCIe 4.0带宽高,1条顶2条,可以连接更多设备而不需要担心性能下降。

此外,X570平台除了PCIe 4.0之外,其他SATA、USB 3.1 Gen2、NVMe等标准也要比Intel的Z390平台更好,扩展接口数量更多,搭配更灵活,所以在X570平台上,AMD及主板厂商有了打造顶级平台的底气,这一点也是跟以往300、400系芯片组最大的不同,有先进技术就能任性。

▍总结:从优秀到卓越,第三代锐龙各种优点“我全都要”

从AMD的7nm Zen2架构设计来看,AMD在这一代处理器上可以说志向远大,不论单核还是多核性能,或者是能效、温度、成本,AMD的目标简直就是下面这张图所展示的那样:

AMD官方的PPT并不能代表实际的性能如此,最终的表现如何还要看测试, AMD“全都要”的目标到底能实现多少。完全评测也会在7月7日的晚上9点解禁,来太平洋电脑网打开看详细的对比数据吧。