·聚焦:人工智能、芯片等行业

欢迎各位客官关注、转发

前言

生成式 AI在经历了一段时间的激烈竞争后,现已步入实际应用阶段。

在此过程中,边缘应用,特别是工业机器视觉、可穿戴设备以及消费者机器人等领域,已逐渐成为其落地实践的核心场景。

作者| 方文三

图片来源 |网 络

打开网易新闻 查看精彩图片

边缘AI进化下面临挑战

随着Transformer与大模型技术的持续进步,AI模型的通用性、多模态兼容性和模型微调效率均取得了显著的提升。

同时,低功耗AI加速器和专用芯片的集成于终端设备中,推动了边缘智能的独立性和强大能力。

在视觉和生成式AI应用场景中,如视频解析、图文融合、图像增强与生成、图像分类和目标检测等,Transformer架构展现了巨大的价值。

由于其注意力机制易于利用并行计算,显著提高了硬件利用效率,使得这些模型能够部署在资源受限的边缘设备上。

边缘AI的巨大潜力预示着其将成为多个领域智能化演进与转型的关键驱动力。

①设计边缘AI芯片和系统时,需在计算能力与能效之间寻求恰当的平衡,以确保高效性能的同时,满足功耗和成本限制。

②高性能处理能力往往伴随着较高的功耗,而边缘设备对功耗和成本有着严格的要求。

因此,我们需要在保证性能的同时,尽可能降低功耗,以延长设备的使用寿命。

③随着越来越多的数据在边缘进行处理,数据安全和隐私保护变得尤为关键。因此,边缘AI芯片设计必须包含加密和安全功能,以确保数据的完整性和安全性。

④鉴于边缘AI应用的多样性,为统一多样化的应用需求并实现规模化效益,软件定义和易于软件移植的标准显得尤为重要。

打开网易新闻 查看精彩图片

Arm发布新一代Ethos-U AI加速器

随着人工智能技术的不断发展,对高性能计算领域的需求持续上升。作为一种专为深度学习和人工智能应用设计的硬件加速器,NPU的出现标志着AI硬件架构的重大进步。

NPU加速器的崛起,源于人工智能和深度学习算法在各行业的广泛应用,以及对高性能计算需求的持续增长。

对于Arm而言,设计高性能产品并非难事,关键在于如何精准地定义产品。

Ethos-U85与此前同系列产品的一个显著区别在于其对Transformer模型的支持。

通过链化技术,Ethos-U85将元素级运算与先前的运算相结合,从而减少了SRAM在写入和读取中间张量时的需求。

这种优化降低了NPU与内存之间的数据传输量,进而提升了NPU的效率。

打开网易新闻 查看精彩图片

作为业界首款AI微加速器,Arm Ethos-U NPU系列一直备受关注。

作为该系列的第三代产品,Ethos-U85专为边缘AI设计。

其优势不仅体现在硬件层面,更在于软件工具链的一致性和易用性。

Ethos-U85为高性能边缘AI应用带来了显著的性能提升和能效改进。

具体而言,它实现了四倍的性能提升和20%的能效提升,同时保持了一致的工具链,为开发者提供了无缝的体验。

该产品支持从128到2048个MAC单元的配置,并在最高性能配置下提供4TOPs的AI算力。这使得其能够应对各种复杂的AI任务。

Ethos-U85的目标应用场景广泛,包括智能家居、零售、工业等新兴边缘AI领域。

它不仅支持低功耗MCU系统中的AI加速,还可在高性能边缘计算系统中与应用处理器、标准操作系统和高级开发语言无缝集成。

这种模式为云原生开发和云边端负载调度提供了有力支持。

值得一提的是,全新的Ethos-U85 NPU还支持TensorFlow Lite和PyTorch等主流AI框架。

除了提供卷积神经网络(CNN)所需的权重矩阵乘运算外,它还能支持矩阵相乘,这是Transformer架构网络的基本组成部分。

打开网易新闻 查看精彩图片

Corstone-320全新物联网参考设计平台

Arm公司同步推出了全新的物联网参考设计平台——Corstone-320,该平台致力于推动语音、音频和视觉系统的高效部署。

Corstone-320物联网参考设计平台集成了Arm公司最高性能的Cortex-M CPU——Cortex-M85、Mali-C55 ISP以及全新的Ethos-U85 NPU。

为广泛的边缘AI应用提供了卓越的性能支持,如实时图像分类、目标识别以及在智能音箱上实现具备自然语言翻译功能的语音助手等。

此外,Corstone-320物联网参考设计平台还提供了全面的软件、工具和支持,包括Arm虚拟硬件。

其软硬件一体化的设计使得开发者在物理芯片准备就绪之前即可启动软件开发工作,从而大大加快了产品上市速度,缩短了日益复杂的边缘AI设备的上市时间。

借助Corstone-320预先集成、预先验证的参考设计模板,Arm能够助力合作伙伴有效降低边缘智能芯片的开发成本,缩短开发周期。

打开网易新闻 查看精彩图片

Arm旨在瞄准国产CPU市场

Arm中国的工程师正致力于将其NPU驱动程序集成至加速器子系统中,这一举措显示出他们正努力将其技术融入更广泛的行业生态中。

此外,安谋科技推出的[周易]X2 NPU在性能上有了显著的提升,并且支持软件开源,这意味着它能够更加高效地利用CPU、GPU、NPU等多种计算资源。

这种开放性和兼容性对于促进国内CPU产业的进步具有重大意义。

与此同时,海光信息作为国内CPU和DCU领域的领军企业,在信创产业和AI市场的共同推动下实现了迅猛的发展。

这充分表明,国产CPU在市场上的地位正在稳步提升,尤其是在AI领域的强劲需求下。

Arm中国研发的NPU加速器,通过提供高性能、低功耗的专用硬件加速,以及丰富的调试工具和多种层次的开发与调试支持;

为国产CPU提供了强大的技术支撑和优化空间,从而助力国产CPU在AI领域的应用和发展。

这一成果不仅有助于推动国产CPU技术的进步,更能够提升国产CPU在AI领域的竞争力,为实现国产CPU的自主可控和发展提供有力支持。

打开网易新闻 查看精彩图片

结尾:

边缘AI将在大模型和生成式AI崛起的背景下,持续提高用户体验,并应对数据量的快速增长。

大模型通过量化、剪枝和聚类技术的不断优化,将更适应在边缘和超级终端设备上部署。

大小模型在云、边、端的协同结合,将成为未来AI产品的重要发展方向,为AI应用在各行业的赋能提供有力支持。

部分资料参考:51CTO:《Arm马健:以新一代 Ethos-U AI加速器及全新物联网参考设计平台》,电子产品世界:《Arm推出新一代Ethos-U AI加速器及全新物联网参考设计平台》,雷锋网:《Arm全新NPU性能提升4倍,支持Transformer,边缘生成式AI时代指日可待》

本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。

请务必注明:

「姓名 + 公司 + 合作需求」