新的汽车架构正在颠覆处理器与存储器的选择|dram|处理器|存储器|控制器|汽车架构|闪存

来源：市场资讯

（来源：Imagination Tech）

本文作者：Ann Mutschler，Semiconductor Engineering高级执行编辑

关键要点

辅助驾驶和自动驾驶需要来自更多传感器的更多数据，并且需要对其中部分数据进行更快速的处理。
向软件定义汽车和集中式智能的转变，使得更容易识别出哪些地方需要最先进的处理器和存储器，哪些地方可以部署更老、更廉价的技术。
汽车以太网和LPDDR等过去很大程度上被忽视的技术，已经发展到突然被大量需求的程度。

来自辅助驾驶和自动驾驶传感器的数据爆炸式增长，以及基于这些数据做出实时决策的需求，正对汽车中的存储器和存储子系统提出前所未有的要求。

随着越来越多的机械功能被电子器件取代，以及汽车智能化程度的提高，汽车领域面临的挑战正与大型数据中心遇到的挑战趋同。对于自动刹车、车道保持、倒车影像处理和悬架调节等关键功能而言，处理单元和存储器内部及之间的数据传输必须极其迅速，以便优先保障这些关键功能。

与此同时，这些车辆还包含了各种重要程度不同的功能。例如，信息娱乐系统虽部分功能对提醒驾驶员至关重要，但其他功能则并非如此。这里的挑战在于，既要将车辆作为一个单一系统来管理，又要将其视为一个由多个系统构成的系统，其中某些功能优先于其他功能。而最佳的解决方法是增加带宽、减少延迟，并更精细地确定在何处、使用哪种制造工艺以及以何种成本部署哪些组件。

“当我们讨论具有服务质量的10千兆汽车以太网之类的东西时，传统的汽车工程师会问：‘我怎么保证这个信号能在100毫秒内实际传到刹车？’”西门子EDA混合物理与虚拟系统、汽车及航空航天/国防部门副总裁David Fritz表示。“我的回答是，‘你看到两个街区外的那栋楼了吗？如果你拿一根双绞以太网线，绕过那栋楼，再一直拉回这里，延迟可能也就几微秒，而你担心的却是毫秒。’这是因为传输速率非常高。即使发生冲突处理，你也有充足的时间来解决。因此，过去那种担心系统繁忙时数据能否足够快地从A点传到B点的顾虑基本消失了。那种关于如何划分我那1.5兆比特每秒的CAN总线以确保数据送达的担忧也烟消云散了。这就是兆比特和千兆比特的区别。”

这对汽车设计产生了巨大影响。“如果你正在通过网络将高优先级数据包从A点发送到B点，而网络因为正在传输视频帧而非常繁忙——而且由于现在一些原始设备制造商在车外装了16到20个摄像头，我根本不知道网络上还有什么——你希望尽可能在车辆边缘处理掉尽可能多的数据，”Fritz说。“这降低了对带宽的要求。中国的主机厂明白，如果他们一次性从20个高清摄像头发送数据，即使发生碰撞，他们仍然可以处理这些数据，存储帧，并用AI处理这些帧。他们可以快速地将数据送入AI算法，因为现在他们使用的SoC延迟只有纳秒和皮秒级别，而竞争对手有几个ECU，如果运气好，这些独立的ECU之间有几个兆比特的通信通道。归根结底，这就像设计SoC一样来设计汽车。”

这也使得汽车制造商能够使用各种处理单元和存储器，专注于哪里需要最高性能、哪里可以缩减规模、不同功能需要多少能耗，以及这一切的总成本。

“传统上，这些功能依赖于MPU或DSP，但现在人们越来越有兴趣利用GPU来执行其中一些任务，”Imagination Technologies高级产品经理Amir Kia表示。“例如，在座舱信息娱乐和驾驶显示屏方面，许多公司已经在使用GPU。开发者认识到GPU的灵活性使其能够高效地同时处理计算和图形任务。与其集成额外的加速器，他们认为扩展现有GPU的能力来管理信息娱乐和增强计算性能更有价值，从而减少系统开销。这种转变也为在这些系统中使用更小的MPU或最大限度地减少对DSP的依赖开辟了机会。”

迈向软件定义汽车

这些变革中的许多都是汽车制造商的基础性转变，他们直到过去十年才开始将重点从ECU转向软件定义的方法。其好处在于，不同的系统和子系统可以像SoC中的模块一样被设计，然后在任何合适的地方以任何合适的方式进行融合。这反过来又使得判断以下问题变得更加容易：何处需要多少带宽、需要多大的存储容量、哪种类型的存储器在什么地方效果最佳，以及哪些数据具有最高优先级。

“每个人都在试图转向更集中的架构，”Kia说。“我们使用了大量分布式ECU，我们想要转向更集中的基础架构。一些客户的平台计算负载很重，需要处理来自传感器和显示器的海量实时数据。一个客户有6个摄像头，另一个有8到12个摄像头，都在同时传输数据流。因此，系统内部需要快速交换大量数据，他们正试图将所有功能整合到一个SoC中来处理这些数据。”

软件定义汽车与一系列功能特定的ECU截然不同。虽然不同的系统必须按要求执行其功能，但这些车辆中的中央逻辑也能够做出涉及多个系统的实时决策。然而，要做到这一点，必须提供正确的数据以便采取行动。

“高分辨率传感器、AI加速器和安全关键型工作负载都汇聚到共享的存储器和存储子系统上，如果没有足够的带宽，这些子系统很快就会成为性能瓶颈，”Rambus Silicon IP业务发展总监Adiel Bahrouch说。“如果存储器无法足够快地为计算引擎提供数据，芯片利用率就会下降，延迟就会增加，直接影响安全和用户体验。分层式存储器和存储体系——从超快的片上存储器到大容量持久性存储——确保了每个工作负载都能在带宽、延迟、容量和成本之间取得恰当的平衡，最终实现安全、响应迅速且功能丰富的车辆。”

随着这些架构上的转变重塑汽车领域，存储器技术的选择变得越来越重要。“从L3级向L4级及更高级别演进时，模型的复杂性、精炼度和效率仍然是主机厂关注的焦点，”美光科技产品和系统副总裁Michael Basca指出。“我们都见过一些自动驾驶出租车在交通中陷入某些困境的情况，所以很明显，我们还没有达到模型可以处理所有各种极端边缘情况的程度。即使在更高级别，在存储方面，模型在变得更高效之前，很可能在一段时间内仍然会变得更大。”

在更微观的层面上，电动化车辆中部署的存储器类型取决于响应时间的关键程度、目标细分市场以及车辆的动力来源。对于纯电动汽车而言，更长的续航里程是一种竞争优势，而用于移动数据的功耗越少，车辆的续航里程就越长。因此，虽然GDDR容量更大，但LPDDR6对于特定功能可能就足够了。

“LPDDR存储器最初流行是因为它提供了比DDR更高的带宽，”Cadence硅解决方案集团总监Frank Ferro说，“最初的LPDDR4大约为4 Gb/s。但到了LPDDR6，我们达到了高达14.4 Gb/s的存储带宽。这是第一个重要优势。你获得了大量带宽。低功耗当然也很重要。另一个优点是它提供了稍大的存储容量。LPDDR6的容量不如DDR，但在汽车应用中，随着我们进入ADAS和AI推理，容量变得非常重要。LPDDR6在存储容量和存储带宽之间取得了平衡，似乎满足了许多汽车应用的要求。”

然而，L4级和L5级自动驾驶为此带来了新的变数。“为先进功能增加片上存储容量和带宽的主要权衡在于芯片面积和功耗的增加，这会影响热管理和可靠性，”新思科技嵌入式存储IP产品管理总监Daryl Seitzer说。“设计人员必须在性能要求与功耗和面积限制之间取得平衡，通常会利用低电压操作和架构优化。”

1：ADAS 带宽需求。来源：美光科技

此外，随着语言模型在汽车中变得越来越复杂，用户发现他们需要更大的存储容量和带宽，并正尝试在成本之间取得平衡。“以特斯拉为例，你可能会发现车上用了四颗 LPDDR 存储器，”Ferro 说。“他们曾想，‘我们可以用更少的 GDDR’，但现在他们为了容量使用了相同数量的 LPDDR，因此很多客户都开始转向 LPDDR6，因为他们现在需要那样的容量（加上 LPDDR 的其他优势）。”

高带宽存储器（通过硅通孔连接的堆叠式 DRAM）由于涉及 TSV 和振动相关的可靠性问题，目前尚不能用于汽车领域。但由于对高性能存储器的需求不断增长，它肯定已经进入了一些公司的视野——在某些情况下，这甚至会以牺牲成本更低的存储方案为代价。

“存储器行业高度集中，少数几家头部厂商占据垄断地位，其产能与所有其他行业共享，”Yole Group 首席半导体分析师 Yu Yang 表示。“因此，对于有志于转型的主机厂来说，了解存储器行业相当关键。一个很近的例子就是，由于 AI 需求、产能转移以及/或者分销渠道的投机行为，DDR4 存储器的价格在过去几个月里飞涨。”

根据 Yole Group 的数据，当前汽车应用中存储器类型和用途的细分包括：

DRAM (LPDDR4/5, GDDR6)：用于 ADAS 域控制器、中央计算、智能传感器和数字座舱 SoC；
NAND 闪存；
eMMC/UFS：用于信息娱乐、远程信息处理、ADAS 软件存储；
NVMe SSD：用于新兴的 L3级以上自动驾驶计算和 EDR/DSSAD 存储；
SLC NAND：用于远程信息处理、射频模块和高耐久性日志；
NOR 闪存：用于 ADAS 传感器、网关、区域控制器和 MCU 中的启动和安全代码；
其他非易失性存储器 (EEPROM, FRAM, nvSRAM)：用于校准数据、配置参数和低密度事件日志。

一个常用的经验法则是：DRAM 用于计算，NAND 用于数据，NOR 用于代码。

其他存储器类型

DRAM 正变得越来越快，而 SRAM 仍然是追求最高性能时的首选存储器。然而，其他类型的存储器也开始悄然进入汽车应用。

“SRAM 支持实时计算任务，而 MRAM 和 RRAM 提供高密度、低功耗和持久存储，使其非常适合无线更新、数据记录和配置保留，”新思科技的 Seitzer 说。“这些存储器选择满足了汽车行业对最优能效、性能和可靠性的需求。”

此外，一些数据可以在车辆中进行预处理并本地存储，然后再发送到云端处理那些对时间要求较低的任务，例如分析车辆行为或车队中的地图变化。“数据不会立即上传到云端，而是存储几个小时或最多一天，具体取决于使用了哪个云服务商（AWS、Microsoft Azure、Google Cloud），”Cadence Tensilica 产品集团汽车产品营销与管理总监 Amit Kumar 说。“这些类型的数据流通常先在汽车内部积累，然后在数据仓库中进行结构化分析。”

闪存在这方面特别有用。“闪存（非易失性、长期存储）在 ECU 和中央控制器中仍然很常见，”Seitzer 说。“非易失性存储器可在车辆整个生命周期内保留数据，为固件、日志和安全资产提供持久存储。对外部芯片数据的访问利用 eMMC 和 UFS 等接口，对于高带宽应用则使用 PCIe。通过加密、认证和遵守汽车安全标准来确保安全性。”

每个主机厂都会根据广泛的选择和目标市场来决定自己的存储器和存储架构。

“来自外部摄像头的录像，以及（如果启用的话）来自座舱摄像头的录像，可用于‘车队学习’，以改进自动驾驶和全自动驾驶功能——这些通常是捕捉与碰撞或气囊弹出等安全事件相关的短片，”Keysight EDA SDV 产品线经理 Carrie Browen 说。“例如，特斯拉描述了不同的类别，如‘自动驾驶分析与改进’和‘路段数据分析’，用于训练和完善驾驶辅助及导航功能。一些数据，如行车记录仪录像和哨兵模式存储（用于监控停车周围威胁），除非你明确允许分享，否则是在车上本地处理的。实际上，数据一部分存在于车辆上，一部分存在于支持 AI 训练、服务和运营的特斯拉控制的数据中心（及合作伙伴设施）中。”

如今，高速 DRAM 通常用于近计算存储，而闪存和其他非易失性存储选项则提供数据备份和冗余。但这些界限正开始变得模糊。

“未来的架构将通过使用更多的混合存储层级来获得更大的灵活性，这些层级将传统的 DRAM 和闪存集成在单个模块或封装内，”Browen 说。“对于用于 AI 改进的摄像头和传感器数据，标注和审查工具允许授权员工和承包商查看短片和图像，以对物体和驾驶场景进行注释。关于过去标注操作的媒体报道描述了此类界面，但没有披露其确切的技术栈。”

结论

汽车正变得越来越复杂，成为集成了越来越多存储器类型和处理单元的“系统的系统”，并需要更新更好的数据传输和存储方式。

“包括信息娱乐和 ADAS 在内的车载计算需求，对存储带宽和容量的要求越来越高，”Keysight EDA 存储解决方案项目经理 Randy White 说。“基于车载推理（而非云端）的低延迟确保了实时处理和对任务关键型时序的要求。”

这些都是通往全自动驾驶道路上的垫脚石。考虑到这项技术的发展轨迹，全自动驾驶很可能在不久的将来实现。

作者介绍

Ann Mutschler 是Semiconductor Engineering的高级执行编辑

https://semiengineering.com/new-automotive-architectures-are-shaking-up-processors-and-memory-choices/