英伟达的Tegra系列由于没有基带支持、本身功耗控制以及市场导向等问题,在手机发展上折戟,同时也随着平板市场的萎缩而渐渐销声匿迹。目前,采用Tegra芯片的产品除了英伟达自家的平板电脑外,就只有谷歌、微软、惠普等厂商部分产品了。
不过在汽车智能化市场,Tegra产品却打出了一片天地,英伟达不但推出了Driver CX系列数字化座舱,还推出了专门面向自动驾驶的Driver PX系列产品,核心都是Tegra处理器。2016年8月,英伟达又发布了全新的TegraParker,这一次,又有什么新的技术出现呢?
在自动驾驶技术上,眼前比较流行的实现路径之一就是汽车通过搭载各种摄像头、雷达、红外线等探测器采集图像数据,再将这些信息通过中央处理系统的深度学习算法进行处理和分析,最后发出指令来控制汽车并实现自动驾驶。在这个过程中,深度学习算法所需要的并行计算能力就显得颇为重要,而GPU在这方面有天生的优势,高度并行、海量规模的架构能很好的满足深度学习的需求。
在之前的发布会上,英伟达在展示全新一代的Driver PX2时,就曾提到这款自动驾驶处理平台搭载了两颗全新的Tegra处理器和全新一代Pascal架构的GPU,整机的深度学习能力高达24DL TOPS(深度学习每秒计算兆次),远超前代产品。其中Pascal架构的GPU自然是重头戏,不过两颗全新的Tegra处理器也不可小觑。不过当时英伟达并没有公布太多这两颗处理器的信息,直到2016年8月,英伟达终于正式发布了这款被称为全新的Tegra Parker处理器。
▲英伟达在之前的路线图中出现过Tegra Parker的身影,相比最终发布的产品变动还是相当大的,比如GPU部分就升级为了Pascal,CPU部分也不只是Denver。
▲英伟达CEO黄仁勋手持DriverPX2,宣布Tegra Parker的发布。
“2+4+256”超强规格,令人震撼
按照惯例,首先来看TegraParker的规格。
和之前的TegraX1、Tegra K1 A15版本完全不同的是,在TegraParker拥有6个CPU核心,且英伟达自有的Denver系列架构又出现了,还升级到了Denver 2。宏观上来看,Tegra Parker的CPU部分有两个簇,其中一个簇中包含了2颗Denver 2架构的CPU核心,另一个簇中包含了4颗Cortex-A57架构的核心,两个簇之间通过缓存后再使用HMP总线互联并保证缓存一致性。
▲Tegra Parker的核心结构简图。
▲Driver PX2使用了2个Tegra Parker处理器。
缓存方面,TegraParker的2个Denver 2核心和4个Cortex-A57核心分别配备了2MB的L2缓存,然后双方的L2缓存再通过一致性单元连接在一起。L1缓存方面有点复杂,Denver 2和之前的Denver一样,使用了128KB指令缓存搭配64KB数据缓存;而Cortex-A57则是48KB指令缓存搭配32KB数据缓存,从缓存容量的差别上就能看出双方架构设计存在巨大差异。内存方面支持LPDDR4内存,带宽为50GB/s,支持ECC校验,相比上代产品大幅度提升。
▲Tegra Parker对比上两代产品,进步巨大。
GPU方面,之前的Tegra X1使用的是Maxwell架构,集成了256个CUDA Core。在TegraParker上,GPU的架构采用了更先进的Pascal,CUDA Core数量还是256个,性能功耗比进一步提升。
不过,本次英伟达几乎没有给出任何有关Denver 2架构的信息,也没有说明新的架构在何处进行了升级。只是简略提到了Denver2依旧是7-way的超标量架构、支持乱系执行、每瓦特性能非常优秀、支持低功耗模式等。
有关Denver架构的一些背景知识
说起Denver2,就不能不提及Denver。Denver是英伟达在2014年发布的自研CPU架构及产品,这也是英伟达首次以自主研发的姿态进入CPU市场。在Denver上,英伟达采用了完全不同于ARM公版架构的设计,其类似全美达的VLIW超长指令集架构、支持OOO乱序执行。Denver的7-way的超标量管线很少见,L1缓存为4-way,128KB指令缓存搭配64KB数据缓存,16-way的2MBL2缓存。
Denver的频率非常高,一般可达2.3GHz到2.5GHz,性能表现也非常不错。它的性能特点在于注重单线程性能,甚至可以媲美“单线程性能之王”苹果A系列处理器,比如在大部分综合测试中,单核心性能部分Denver核心的Tegra K1处理器的都和苹果A8X处理器基本持平。
Denver以及其后续产品的发展,一直是业内关注的重点。只不过Denver 2发布后,目前还没有太多资料,也只有等待未来进一步测试才能得知其性能究竟如何。
工艺方面,TegraParker升级到了TSMC 16nm FinFET工艺,在晶体管密度、电压等方面要比之前半代工艺TSMC 20nm要强很多。
再来看看核心的搭配问题。这次Tegra Parker的CPU部分采用的是“2+4”的模式,一般来说,如果采用ARM的big.LITTLE架构的话,应该是“高性能核心+节能核心”的模式,但是Tegra Parker却是“Big+Super”也就是“高性能核心+超高性能核心”的模式,这样一来,Tegra Parker面向的市场基本就放弃了手机,甚至平板上使用Tegra Parker可能也会存在散热问题。不过,Tegra Parker面向的市场应该就是车载和大尺寸设备,并不用太担心功耗问题,这样的搭配反而能取得最好的性能。
▲Tegra Parker的处理器部分结构简图
▲Tegra Parker上对CPU部分做出的一些特殊设计。
另外,Tegra Parker中还有一些问题需要考虑:比如为什么使用两颗Denver 2搭配四颗Cortex-A57而不是四颗(甚至六颗)Denver2?为什么不是六核心Cortex-A57(或者Cortex-A72)?对此英伟达做出了一些解释。比如自动驾驶需要更强大的单核心性能、无论是自动驾驶还是游戏都需要更多的核心、总性能需要进一步提升等。而且为了满足这六颗核心高效率运作,英伟达还设计了多项辅助技术,其中自动排序技术可以让Task能够自动排序运行在正确的CPU核心上、当计算需要改变时可以自动移动Task或者线程去正确的核心、在不同的核心簇之间移动任务时保证缓存一致性等。
当然,有一种猜测是可能在汽车自动驾驶的应用场景中,需要单线程性能强悍的核心来对某些事项实现高效率的处理,性能要求较低但并行性要求较高的事项可能会交给四颗Cortex-A57来充分发挥,这也是比较实际的设计方案。
为自动驾驶优化Tegra Parker的功能性设计
除了核心设计外,还有一些功能性的内容。比如存储方面,Tegra Parker支持eMMC 5.2,SATA接口,比前代规格更进一步。视频方面支持2160p的60Hz编解码;摄像头方面支持12路HDR摄像头,都远胜前代产品。
▲Tegra Parker的特性一览
在自动驾驶方面,TegraParker支持最新的以太网音视频桥接技术,这是一项新的IEEE 802技术,主要目的在于建立高质量、低延迟、时间同步的音视频以太网络,实现实时音视频流的传输,这在自动驾驶上能够提供同步的音视频数据,提高安全性。此外,Tegra Parker还提供了Dual CAN和QSPI的支持,其中CAN是控制器局域网络(Controller Area Network, CAN)的简称,是博世推出的现场总线标准,已经成为了ISO 11898国际标准。CAN总线主要优点在于结构简单、各节点可以自由通信、节点数量理论上不限制等,在汽车上有重要应用。Tegra Parker支持双CAN接口。QSPI则是Queued SPI的简写,属于SPI接口的扩展,属于一种高效的传输接口,多见于工业设备和汽车等场合。
在安全方面,TegraParker支持Automotive Rated SoC,更宽泛的适应性设计、片上安全管理等技术,这些技术都是全新加入。虚拟化方面,Tegra Parker也支持最多8路硬件虚拟化,以便支持更多虚拟用户的使用。
▲Tegra Parker支持虚拟化技术
性能英伟达说它打遍天下无敌手
看完规格基本后,再来看看性能。目前由于不存在Tegra Parker的相关设备,因此性能都来自于英伟达的官方内容。在偏重整数性能的SpecInt2K测试中,如果Tegra Parker的性能是1的话,那么苹果A9X最多只有0.6,华为的麒麟950也是0.6,三星Exynos 8890略低,高通的骁龙820大约只有0.4左右。英伟达宣称TegraParker的处理器性能比A9X等处理器最多提升67%,比骁龙820提升高达150%。
▲英伟达给出的Tegra Parker性能,只有CPU部分,测试条件不是很明确。
除了处理器性能外,有关Tegra Parker的功耗、GPU性能方面基本就没有任何信息了。对于GPU性能,考虑英伟达目前在GPU届的地位以及Pascal架构GPU出众的表现,TegraParker应该是目前所有ARM SoC中顶尖的选择。
功耗方面,从架构设计来看,Tegra Parker的功耗肯定不会太低,猜测其在最极端情况下有可能会达到15W~20W左右。因为之前Tegra X1的功耗最高可能在15W附近,Tegra Parker与其类似,但是加入了2个Denver 2核心,即使制程改换,但是晶体管数量变多、频率提升,功耗也会持续上升。当然,英伟达如果考虑将Tegra Parker集成在SHILED游戏机中的话,应该会在功耗控制、频率控制上有另外的方案,功耗也可能会大幅度降低,甚至有可能低于10W。
▲Driver PX2上的TegraParker
写在最后
总的来看,TegraParker的规格相当令人震撼,完全是以面向较高性能场合而设计的处理器,虽然其性能无法和英特尔、AMD的高端X86处理器相媲美,但是在诸如车载、娱乐等场合还是相当适用的。而且这次英伟达是铁了心杀入汽车市场,准备彻底投入了这个庞大的蓝海,誓不回头了。Tegra Parker和英伟达的自动驾驶技术一起,带给英伟达的不光是股价飙升、也不光是汽车市场,而有可能是未来十年发展的根基。
不仅如此,从TegraParker的发布、以及英伟达现在官网都没有Tegra Parker的介绍等迹象可以看出,Tegra这个品牌有可能在未来会离普通消费者越来越远。因为没有大量移动终端的加持、全身心进入汽车市场的话,消费者将逐渐淡忘这个品牌。对全新的汽车用户来说,根本没必要去了解汽车用的谁家的处理器,最多只有极客在购车时会考虑自动驾驶模块来自于哪家。一个品牌的逐渐隐退,换来的可能是一个千亿级的巨大市场,英伟达的闷声大发财之路,才刚刚开始呢。
热门跟贴