像加塞、急刹,碰撞这样的边缘场景在现实中发生概率极低,但一旦发生就可能导致重大事故。如何在这类场景中安全驾驶就成为了自动驾驶落地的“最后一公里”。

与此同时,这类边缘场景数据的稀缺,正在成为制约自动驾驶模型性能提升的关键因素。一方面,这类场景本就罕见,难以获取大规模的训练数据;另一方面,风险高、采集难,也抬高了数据成本。对数据驱动的自动驾驶来说,缺乏这种对应场景的“极限磨练”,在现实道路上“翻车”几乎不可避免。

为此,来自OpenDriveLab、上海交大、浙大、复旦、Zenseact 和广汽研究院的联合团队,提出 Nexus 框架,通过解耦扩散模型,分块建模局部的噪声演化过程,来模拟这类难、偏、怪的边缘场景,从而提高自动驾驶汽车在这些场景的可靠性。

自动驾驶的最大难题,不是跑得快,而是自动驾驶汽车能不能在各类边缘场景(corner cases)中跑得稳。

一、什么是 Nexus?

Nexus 就像一个聪明的“场景生成器”,它能根据预设目标快速构建出包含多车交互、突发变道、急刹、碰撞等交通场景,而且比此前的方法更灵活、更可靠。

此前的做法要么是一次性生成整个视频,但存在生成慢、对目标难以把控的问题;要么是一帧帧预测,虽然快,但却容易出现“场景崩溃”。

Nexus 的创新在于:将场景划分为区块,单独建模每个局部的噪声演化过程,再通过状态间约束将它们串成整体,这样既保证了局部合理,又能全局协同边生成边调整,根据每一帧的新信息动态更新后续内容,确保场景既逼真又可控

双管齐下:既要实时高效,又要目标可控

Nexus 的设计目标很明确:生成的场景既要满足实时性,又要满足可控性。

  • 传统扩散模型在“去噪”时,对全部未来时刻一次性处理,速度又慢,又难以干涉中间过程;

  • 自动回归方法虽然能即时更新,却缺乏目标状态的指引。

这两类传统方法导致模型无法兼顾交互性和可控性,而 Nexus 的两大核心创新正解决了这一问题。

1. 噪声状态的“解耦”扩散建模:既快又听话

Nexus 并不是让整个场景⼀次性扩散,⽽是将整体场景划分为多个轨迹单元,每个单元在⾃⼰的时间轴上独⽴扩散噪声状态。然后再通过⾏为规则和逻辑约束,协同各个单元。从⽽使建模速度⼤幅提升,且每条轨迹都能精确引导。

2.噪声感的调度机制:像“动态滑窗”⼀样顺序生成

Nexus 根据各区块的噪声强度动态决定⽣成顺序,类似滑动窗⼝式优化。优先处理“最模糊”的部分,逐步收敛到清晰合理的全局场景。这⼀做法使得⽣成时⻓更短,时序⼀致性更好,避免局部误差向全局扩散。

Nexus-Data:540 小时边缘场景库

为了在边缘场景中有更好的表现,Nexus 团队还构建了包含数千个⾼危瞬间、总时⻓达 540 ⼩时的 Nexus-Data 数据集,覆盖加塞、碰撞、逼停等多种边缘场景,为模型训练提供充分的“极限考验”。

三、实验效果:大幅降低误差,提升准确率

  • 轨迹误差降低 42%,生成的场景更加自然、精准

  • 生成数据用于训练后,规划准确率提升 20%

  • 支持闭环测试、策略学习、仿真评估等实际环节,真正能落地的生成方案


四、边缘场景生成表现

五、基准测试对比(nuPlan数据集)

Nexus-Full 在控制精度、安全性、稳定性三个维度均超越已有方法,同时保持合理的推理时间,达到了SOTA。

任务为基于 2 秒历史预测 8 秒轨迹,含/不含目标引导。

Nexus 支持闭环场景生成,能作为自动驾驶智能体的交互式仿真环境。智能体在生成场景中进行规划,Nexus 则根据其动作实时更新环境,从而实现感知—决策—反馈的闭环。

闭环交互式场景生成性能对比(Scol/Sp)

此外,Nexus 不仅能“生成”,还能作为数据引擎为模型训练提供更多关键场景,提升模型实战表现。

使用合成数据进行数据增强的对比实验。

Nexus通过解耦扩散模型突破动态场景生成的技术瓶颈,代码与部分数据集已开源,详情参考OpenDriveLab官网

llustration From IconScout By IconScout Store

-The End-

本周上新!

扫码观看!

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区(www.techbeat.net)。社区上线600+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。

投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //

投稿须知

稿件需要为原创文章,并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励

投稿方式

发送邮件到

melodybai@thejiangmen.com

或添加工作人员微信(yellowsubbj)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。

关于我“门”

将门是一家以专注于数智核心科技领域新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈