苹果在M5 Pro 和 M5 Max上推出的 Fusion 架构 突破了芯片组开发的限制,在保持出色能效的同时,集成了更多运行频率更高的 CPU 核心。目前只剩下 M5 Ultra 尚未发布,但与其他 SoC 不同的是,关于其架构的细节信息却很少。
UltraFusion架构已在实际应用场景中经受住了考验,而重复利用旧设计有助于提高M5 Ultra的良率并降低成本。
尽管此前有报道称 M5 Ultra 将采用单芯片设计,但 Frenchy on X 的 Fred 认为苹果仍会继续使用 UltraFusion 技术,将两颗 M5 Max 芯片合并成一颗。原因很简单:苹果已经将 UltraFusion 技术应用于三款工作站级芯片,每一款都显著提升了计算和 GPU 性能。
纵观以往将两颗SoC芯片融合在一起的工艺,显然,这种工艺成本更低,良率更高,这意味着M5 Ultra可以以更低的成本实现更高产量的量产。UltraFusion Interposer将位于两颗M5 Max芯片之间,每个CPU和GPU模块通过铜-铜(Cu-Cu)直接键合连接,总共形成两个单元。
需要注意的是,铜-铜直接键合工艺成本很高,因此苹果不会选择用它来连接两颗 M5 Max 芯片,而是会采用久经考验的 UltraFusion 工艺。我们猜测,M5 Ultra 的高端版本将配备 36 核 CPU 和 80 核 GPU,以提供最佳的计算和 GPU 性能。
苹果公司也不必再担心在两款产品中使用 M5 Ultra 处理器的问题了,因为它已经放弃了 Mac Pro,这意味着不会再有新的 Mac Pro 机型更新,只剩下 Mac Studio 等待更新。
苹果芯片的“binning”是什么?
过去几周,你可能经常听到“分档”(binning)这个词,它通常用来指代 iPhone 17e 和 MacBook Neo 内部的芯片。但它到底是什么意思呢?简单来说,“分档”就是将同一组产品按特性进行分类,以便出售或用于其他用途。
它的起源可以追溯到农业时期,当时人们会将单一作物的收成分成不同的容器。品质最好的部分适合单独出售,会被放入一个专门运往市场的容器中。外观不太吸引人的部分则会被放入另一个容器中,用于批量折扣销售,加工成食品。而品质和外观最差的部分则会被放入另一个容器中,用作动物饲料或肥料。
如今,“binning”技术几乎应用于所有采矿、采伐和制造行业,从宝石到服装,当然也包括半导体。例如,如果一块内存芯片在3000MHz时钟频率下测试失败,就会被分级出售,作为2800MHz的芯片。
包括英特尔、AMD 和英伟达在内的所有主流芯片制造商多年来都采用“binning”策略。但苹果通过在热门产品中使用“binning”芯片,使这个术语更加普及。以下将介绍分级芯片的运作方式以及苹果如何利用分级芯片来获得优势。
Binning过程详解
处理器(包括苹果的处理器)通常按两种方式进行分级:时钟频率和设计缺陷。芯片会在不同的频率和电压下进行测试,然后根据测试结果分为两类:一类是能够以所需速度通过验证的,另一类则是运行速度较低的。
芯片制造商随后可以将速度最快的芯片以溢价出售,或者像苹果公司那样,将其用于高端产品中,以满足用户对顶级性能的期待。苹果公司并未公开其大多数芯片的频率,而芯片的最终运行速度很大程度上取决于目标设备的散热能力。
更明显的“binning”方法是禁用芯片的某些部分,以挽救那些在制造过程中原本会失败的产品。
现代处理器包含数百亿个晶体管,这些晶体管是通过将高频紫外光照射穿过电路图案的“掩模”蚀刻到硅片上的。这个过程逐层重复,所需的精度令人难以置信。
一块典型的硅晶圆——一块直径约一英尺的圆形扁平晶体——可以生产大约 500 颗芯片,例如 A18,但其中很大一部分会存在缺陷,导致它们无法正常工作。如果苹果公司不得不把这些废品都扔掉,每块晶圆可能只能得到 200 颗(甚至更少)可用的芯片。可用芯片的比例就是硅晶圆的“良率”。芯片制造的成本是按晶圆计算的,因此良率越高,每块晶圆能生产的可用芯片就越多,每颗芯片的成本也就越低。
现代芯片的设计中包含许多重复且功能相同的区域。例如,如果芯片有六个GPU核心,那么每个GPU核心都完全相同。这种重复设计可以用于制造过程中的冗余,使制造商能够将有缺陷的芯片用于其他产品。
通过合理的设计,可以制造出一种芯片,使任何存在制造缺陷的GPU核心在软件运行时被“熔断”并忽略。这样就能将一颗原本带有6核GPU的故障芯片变成一颗可以正常工作的5核芯片。这种技术可以应用于芯片中大量重复部件的任何地方:CPU和GPU核心、缓存、内存接口电路等等。
哪些苹果产品使用了废弃芯片?
使用分拣芯片为苹果产品提供动力已有近十年时间。早在 2018 年,第三代 iPad Pro 发布,它搭载了名为 A12X 的 A12 芯片。A12 采用 6 核 CPU 和 4 核 GPU,而 A12X 芯片则配备了 8 核 CPU 和 7 核 GPU。
我们很快就了解到,A12X 芯片实际上设计了 8 个 GPU 核心。由于良率极低,苹果不得不禁用每个芯片的一个 GPU 核心,才能保证每片晶圆上可用的芯片数量足够,从而降低成本。2020 年初,第四代 iPad Pro 搭载了 A12Z 处理器。它与 A12X 芯片完全相同,只是启用了第八个 GPU 核心。制造良率的提升使得这一改进成为可能。
M1芯片最初搭载于MacBook Air上,配备8个GPU核心。但入门级机型禁用了一个GPU核心,这使得苹果每片晶圆上可利用的芯片数量更多,从而降低了M1芯片的成本。
如今,苹果销售的许多产品都采用了经过筛选的芯片。iPhone Air和iPhone 17 Pro一样,都使用了 A19 Pro 芯片,但 A19 Pro 的 6 个 GPU 核心中有一个被禁用。iPhone 17e使用的是经过筛选的 A19 芯片——17e 只有 4 个 GPU 核心,而普通版 iPhone 17 则有 5 个。入门级 MacBook Air 使用的是 M5 芯片,其中两个 GPU 核心被禁用(总共 8 个 GPU 核心,而不是 10 个)。MacBook Neo 使用的是 A18 Pro 芯片,其中有一个 GPU 核心被禁用。
分级芯片让苹果公司能够提高良率并降低芯片成本。它还允许苹果公司使用性能较低的芯片生产价格更低的产品,而无需专门为其设计全新的芯片。作为为数不多的能够自主研发芯片和硬件设计的公司之一,这赋予了苹果公司巨大的优势。
分档对性能有何影响?
如果你使用的是经过“筛选”的芯片版本,真的会错过完整的体验吗?就像计算机产品的性能经常出现的情况一样,答案是:视情况而定。
在其他条件相同的情况下,芯片的降级版本会因其核心数量的变化而导致峰值性能下降。例如,如果GPU核心数从5个减少到4个,GPU核心数就减少了20%,通常情况下,GPU峰值性能也会下降20%。
例如,iPhone 17e 的 GPU 性能比 iPhone 17 低约 20%,因为它的 GPU 核心数量少了 20%。iPhone Air 的 GPU 核心数量比 iPhone 17 Pro 少了 17%,因此其图形基准测试性能也慢了约 17%。
但事情并非如此简单。几乎没有应用会仅仅受限于单个组件的性能。经过筛选的芯片会被用于不同的产品,这些产品可能配备不同的散热系统、内存速度、最高时钟频率以及其他影响性能的特性。因此,性能差异绝不仅仅是“筛选”芯片本身那一项改动造成的。
一般来说,芯片降级带来的性能下降幅度最大也等于芯片核心数的减少量。例如,M5处理器从10核降到8核,最多只会导致20%的性能下降,而且这种下降只会影响那些对GPU吞吐量特别敏感的应用,而不会影响CPU性能或内存速度等其他因素。
苹果本可以做得更多,让消费者更清楚地了解同名产品可能存在性能差异,但芯片分级并非苹果为了让消费者花更多钱买更低性能的产品而耍的花招。将部分功能失效的芯片回收利用,生产性能较低的版本,是行业惯例,这使得苹果相对于那些无法掌控整个生产流程的竞争对手而言,拥有巨大的优势。
热门跟贴