打开网易新闻 查看精彩图片

商汤绝影智能汽车事业群智能座舱副总裁 许亮

随着生成式AI大热,人工智能已经成为各个垂直行业必然要解锁的「科技树」。而如何让前沿技术真正贴近生活?未来科技又有怎么样的可能?这是一个需要技术方、平台方、场景方、品牌方还有消费者,去共同想象和探索的开放命题。

而在AI的推动下,全球各大车企也纷纷开始探讨如何将AI应用到汽车产业链条中,通过差异化体验来建立独有的优势,从而在非常“卷”的汽车行业冲出重围。

6月13日,在“AI驱动汽车新变革”这一议题下,钛媒体携手环球资源在“消费者科技及创新展览会”(CTIS)期间,举办了2024T-EDGE未来科技大会@CTIS,并邀请到了商汤绝影智能汽车事业群智能座舱副总裁许亮,分享商汤在大模型时代对智能汽车的思考、研发投入及行业变革的见解。

在许亮看来,大模型的兴起,尤其是GPT-4的发布,已经深刻影响了我们的生活,带来了多模态融合的新概念。

而对于AI在汽车领域的变革,许亮将其具体体现总结为三个核心方面:首先,许亮认为大模型将彻底颠覆原有的研发模式,显著提升生产效率。过去,自动驾驶等技术研发依赖大量算法和代码生成,耗费了大量的工程师资源。大模型的引入能够显著提高效率,特别是在新研发方向切换时,将带来质的飞跃。

其次,在交互体验方面,大模型带来了全新的变革。从文本到文本+视频,再到多模态的演化,技术进步使得人机交互更加接近于真人模拟环境。这种技术不仅应用于汽车,还将深深融入我们的生活,带来显著变化。最后,许亮还谈到了万物互联的智能体。在他看来,智能家电和万物互联的概念早已存在,但主要通过远程控制实现。未来,万物互联的智能体将大大改变我们对生活场景的控制方式,使其更加智能和便捷。

同时,许亮也谈到了大模型技术的挑战,尤其是在技术演进和研发投入方面。他提到,大模型的端到端设计对模型能力、数据及研发投入提出了高要求,但这些努力将带来生活和汽车应用的巨大突破。

他预测,这个行业未来每几个月就会有重大的技术突破,带来新的惊喜和体验。像现在这种大模型的上车已经陆陆续续出现了,商汤绝影在今年的北京车展上发布了大模型的矩阵,并计划在未来与多家车厂合作,推动技术的实际应用。

而在通用人工智能的发展中,许亮强调了“尺度定律”的重要性,追求模型的最佳性能和最优解,模型参数的增加和高质量数据的获取是核心要素。他回顾了商汤在大模型上的投入,指出从2018年起,公司就开始布局视觉、语言类及生成式的大模型。在2023年,商汤发布了“日日新”大模型的矩阵,并在4月23日提升到5.0版本,与多家行业领军企业探讨合作价值。

许亮还特别提到了商汤与小米集团的合作,小米汽车发布的多模态大模型背后正是商汤的技术支持。他强调,商汤的5.0版本大模型在知识、推理、代码层面上已经全面对标GPT-4,未来公司将继续加大研发投入,提取更高质量的数据,进一步提升模型性能,为整个行业带来更好的发展前景。

会上,许亮也详细阐述了整个公司GPU的投入情况以及分享了AI技术在车辆领域的实际应用进展。他指出,自2018年起,商汤开始大规模投入GPU基础算力设施建设,目前运营4.5万块GPU,年底峰值算力将达到18000 P 成为行业内的重要力量。

许亮强调,在大模型时代,模型参数的提升必然会带来对算力的需求,因此商汤也致力于融合国产芯片算力,支持了58款国产化芯片的计算能力,实现从硬件到软件再到行业数据的综合性生态融合。

在智能汽车应用方面,商汤绝影的使命是利用AI技术,特别是大模型时代带来的红利,推动智能汽车从1.0向超级智能体的转变。许亮将商汤绝影的思考聚焦在三个方面:智能驾驶、智能座舱和AI智能体。他提到,商汤绝影提出了端到端自动驾驶解决方案,并推出多模态座舱大脑的概念,计划未来推出AI智能体,致力于在视觉和汽车产业结合的过程中取得快速进展。

随后,许亮详细阐述了商汤在智能驾驶领域的成果和计划。商汤在2022年底推出了UniAD,这是国内首个感知决策一体的端到端自动驾驶解决方案,通过一个大模型实现从输入到最终规控的整个自动驾驶过程,显著提高了性能,尤其在复杂路况下表现出色。目前,商汤已在多条道路上进行了公开测试,并计划在明年与多家车厂开展实质性合作。

在智能座舱方面,许亮指出,AI特别是深度学习基于视觉技术的应用,极大提升了汽车的安全性和用户体验。传统物理传感器的应用存在局限,而视觉技术相当于汽车的眼睛,能够感知座舱内外的真实环境,提供超过60%的信息量。他提到,商汤绝影已经推出了包括DMS(驾驶员监控系统)和OMS(乘客监控系统)在内的20多个视觉模型,帮助行业向标准化方向发展。

同时,商汤在多模态大模型的应用上,也展示了其在复杂指令处理方面的突破。许亮举例说明了复杂指令如“等会如果小红书睡着了把空调和窗户调整一下”的处理方式,这类指令包含模糊的语言和人物状态描述,传统的车控方案无法应对,而多模态大模型则能够有效处理,实现更加智能化的交互体验。

许亮还提到,商汤在座舱感知方面的应用,能够处理驾驶员的无意识状态,如身体突然趴在车上等危险场景,通过多模态大模型可以提供更好的检查结果和感知信号。这在满足2026年ENCAP法规的要求上具有重要意义,商汤提出了全新的解决方案,带来真正智能化的座舱体验,彻底颠覆现有车机架构。

除此之外,许亮还展示了商汤绝影在北京车展上发布的多模态场景核心矩阵,并介绍了与多家车厂的合作进展,预计今年下半年这些技术将正式应用于实际车辆中。他强调,多模态模型在提升识别准确率和感知信号方面的重要性,并指出商汤绝影正与芯片公司合作,从云端部署逐步迁移到端上部署,以保证模型的低延时和高性能。

最后,许亮总结了商汤绝影在智能座舱和智能汽车领域的使命,即通过AI技术提高用户的交互体验,降低沟通成本,增强交通和科技的便利性。他表示,商汤绝影将继续推动智能座舱从1.0时代向全面智能体的转变,希望在这一过程中不断带来新的产品和惊喜,为行业注入新的活力。商汤绝影的口号“AGI通用人工智能引起智能座舱体验的新时代”已成现实,期待未来带来更多创新和变革。(本文首发于钛媒体APP)

打开网易新闻 查看精彩图片

大会现场在钛媒体APP等主流平台同步直播,更多嘉宾精彩内容请持续关注大会官网及专题(专题链接:https://www.tmtpost.com/tag/topic/7031566),让我们一起聚焦科技思潮,共话科创未来。