最近,苹果召开了春季发布会,除了紫色的iPhone 12和AirTag之外,最受大家关注的就是搭载在iPad Pro上的M1芯片。
M1芯片是去年苹果发布的一款自研芯片,在去年的发布会上,库克以「One more thing」(还有件事儿)的方式介绍了M1芯片。
熟悉苹果风格的人都知道,「One more thing」可不是随便用的。
这一起源于乔布斯的习惯,之所以被业界奉为圭臬,是因为每当这句经典台词出现,必有激动人心的新品登场。曾经在发布会尾声随着「One more thing」出现在大屏上,为我们带来了第一代MacBook Pro、第一代 MacBook Air。
而在后乔布斯时代,「One more thing」只出现过4次,前三次:2014年带来了当下销量最高的智能手表Apple Watch、2015年带来了全球用户第二多的音乐 App Apple Music,以及2017年把iPhone带入全面屏时代的iPhone X。
第四次带来的则是我们今天的主角「M1芯片」。
M1芯片的意义不亚于当年iPhone重新定义手机,或者准确来说是iPad开启了平板电脑时代这种意义。可以说,由于M1芯片的出现,苹果强大的生态系统才真正完成闭环。
那么,为什么M1能做到「性能提升的同时,功耗反而降低」?
对于芯片设计来说,针对功耗、性能和面积(简称PPA)的优化,是最重要的原则。通常来说,这三点不可兼得。加入多级流水线、增加总线带宽等方式可以提升芯片的性能,但同时也意味着更高的功耗、更大的芯片面积。而如果你要设计一款低功耗的芯片,那么就要牺牲掉一部分芯片的性能。用我们古人的智慧来说,就是「鱼和熊掌不可兼得」。
因而在实际的芯片设计中,要达到完美平衡,对于PPA的优化最为重要。但是苹果M1芯片的横空出世,打破了这种芯片厂商需要小心翼翼才能维持的完美平衡,苹果这次做到了「鱼和熊掌兼得」,而且这事目前只有苹果才能做。
没有比苹果更适合M1的厂商
发布会上苹果介绍,同型号电脑,搭载M1芯片的电脑,性能上比搭载英特尔CPU的性能提升了3倍,图像性能提升了5倍,而且同时功耗还得到了大幅下降。英特尔每年「挤牙膏」式的提升两三成,而这次苹果的M1,直接高了好几倍,简直不可同日而语。
而这种近乎变态的性能提升,来自于四个方面:一、ARM架构精简指令集优势;二、系统级地芯片封装设计;三、封闭的软硬件生态系统;四、神经网络引擎的协助。
我们来一个一个解释。
一、ARM架构精简指令集优势
M1芯片功耗低,和其使用ARM架构有着密不可分的关系。目前市面上主流的芯片架构有两种,一种是英特尔公司的x86架构,另一种就是ARM公司的ARM架构。而ARM架构相对于x86架构来说功耗较低,是因为X86架构用的是复杂指令集(CISC),而ARM架构采用的是精简指令集(RISC)。
什么是指令集呢?简单来说,操作计算机的机器语言集,就是指令集。
指令集复杂,就意味着电路单元多,不过功能强大,同时面积大、功耗高。而指令简单,电路就相对简单,因而面积小,功耗低。所以,市面上绝大部分手机普遍采用的都是ARM架构的芯片,就是因为手机寸土寸金的空间里面,只能装下面积小、功耗低的ARM架构的芯片。而台式电脑、笔记本电脑对于功耗要求就没有那么高,所以x86架构更适合台式电脑。
苹果的M1芯片通过更精简的指令集,配合专门的代码优化和开发,使得软件的执行效率和CPU的低功耗都得到了最大程度地发挥。
当然了,台式电脑虽然对功耗要求不高,但是功耗低点总该是好事吧,为啥不用ARM架构?
要弄清楚这个问题,还得回到ARM架构的特点上来。ARM架构的芯片虽然功耗低,面积小,但是由于ARM架构追求的是高自定义性,具有高度定制化的特点,所以在指令集简单的同时,兼容性也很差,通用性不行。而英特尔的芯片需要应用在各种型号的电脑上,在PC端,即便是同一台电脑,芯片、显卡和内存用的大多都不是同一家供应商,更别说不同品牌不同型号的电脑了。因而,高兼容性对于PC端来说必不可少。
但为何苹果的iMac和MacBook上可以用ARM架构的M1芯片呢?这个我们后面会讲到。
二、系统级地芯片封装设计
通常我们说SoC,是「把系统都做在一个芯片上」,在一块芯片上集成了CPU、GPU、基带、ISP等单元。如果说CPU是大脑,那么SoC就是包括大脑、心脏、眼睛和手的系统。不过,以前的SoC只是集成了一个完整的系统,而这次苹果M1芯片实现了更夸张的完整系统。
除了一级缓存、二级缓存、三级缓存之外,苹果还自己弄了个统一内存,封装在M1上。CPU、GPU、神经引擎、缓存、DRAM内存全部通过Fabric高速总线连接在一起,通过把内存封装进SoC里,并且用GPU核心和CPU核心共享内存,来缩短物理通讯距离,直接实现了超低的访问内存延迟,极大提升了芯片之间的通信效率。而且为了完成如此高密度的封装,M1采用了台积电最先进的5nm制程工艺,成为全球首款5nm工艺的个人电脑处理器。
不过,虽然有5nm制程技术,但苹果为了把M1芯片的面积控制得更小,从而让信号少绕路、减少延迟和功耗,最大只做了16GB的统一内存。
三、封闭的软硬件生态系统
还记得我们前面埋下的坑吗:为何苹果的iMac和MacBook上可以用ARM架构的M1芯片?
这是因为苹果生态本身的封闭性。可以说,苹果是目前唯一拥有自己的芯片、操作系统、软件生态和硬件生态的厂商。因此,对于苹果来说,软件迁移、硬件适配等改变生态的动作虽然也是大工程,但是能在两年内完成,这对于「Wintel」联盟来说是无法想象的。
比如,苹果在A11的时代就在硬件层面终结了对32位应用的支持,而macOS也在2019年的10.15版本里去掉了对32位应用的支持,到如今苹果已经完成了全64位软件的生态准备。而在Windows PC上,你能想象你买回家的Zen 3处理器完全不支持32位应用吗?
苹果对生态的控制使得它可以牺牲一定的兼容性换取更强的性能,而x86就得背着这种具有数十年历史的「x86税」:在增加性能的同时,继续保持着对上古软件的兼容,但这种兼容是要占面积和费电的,这就是「低功耗、高性能」的M1芯片只有苹果能造出来的原因。
而且由于iPhone使用的A系列芯片也是ARM架构,所以iOS的应用也能在装有M1芯片的苹果电脑Big Sur操作系统上使用。这样一来,苹果电脑的软件生态瞬间就扩大了几个量级。所以说M1芯片是苹果生态系统的最后闭环,一点也不夸张。
四、神经网络引擎的协助
苹果利用神经网络引擎作为辅助的图像识别和计算已经好几年了,但是在桌面计算机平台引入神经网络引擎计算,还是第一次。苹果在M1芯片上加入神经引擎处理器(NPU),来协助GPU工作。简单来说,在加入NPU之前,计算机识别图片是依靠一个像素一个像素地进行分析、处理。而有了NPU,就可以像人一样,通过AI学习辨别图片的特征,整体识别图片内容。
比如,一张4000x4000分辨率的小猫图片,我们一眼就看出来是一只小猫。但是如果没有NPU或其他辅助,机器就得通过逐个识别像素点的方式,来认出这只小猫。这样识别4000x4000分辨率的图片和识别400x400分辨率的图片,用时就会差很多倍。但是有了NPU,机器就能够像人一样,整体识别图片,那就不会有这种识别用时上的差别,从而大幅提高处理图片的效率。
可以看到,苹果的M1芯片为了达成「功耗降低、性能提高」的效果,从芯片架构、封装技术、内存设计、软件、算法优化等全方位做了大量的工作,这是其他厂商做不来的。毫无疑问,在苹果的带动下,「低功耗、高性能」将成为未来各大PC厂商研究重点,最终带动行业进步。
写在最后
在今年的春季发布会上,库克化身汤姆·克鲁斯偷M1芯片的场景让不少果粉觉得很酷,其实酷的不只是库克,还有M1芯片。阿汤哥在过往的影片中实现过各种「不可能的任务」,而这次苹果的升级版M1芯片,也在实现着苹果式的「不可能」,再次给业界带来了惊喜:
M1芯片让系统性能提高3.5倍,图形性能提高6倍,机器学习提高15倍,同时使电池寿命比上一代Mac长2倍,这只有苹果能做到。可以说,这是乔布斯式传奇的又一次胜利。
热门跟贴