打开网易新闻 查看精彩图片

本期为TechBeat人工智能社区768线上Talk。

北京时间5月20(周三) 20:00,香港大学博士生吕晓阳的Talk将准时在TechBeat人工智能社区开播!

他与大家分享的主题是:给予动态特征归一化的稳定流式深度估计算法。届时他将深入剖析单目几何模型时序尺度偏移漂移的核心成因,详解动态特征归一化 DyFN 轻量化模块原理,分享冻结主干网络的高效适配方案,同时展示多项基准实验成果,讲解流式 3D 几何估计的稳定优化新思路。

Talk·信息

主题:给予动态特征归一化的稳定流式深度估计算法

嘉宾:香港大学·博士生 - 吕晓阳

时间:北京时间5月20日(周三) 20:00

地点:TechBeat人工智能社区

http://www.techbeat.net/

Talk·介绍

从流式 RGB 输入中进行一致的 3D 几何估计,对于自动驾驶、具身智能(Embodied AI)及大规模重建等现实应用至关重要。 虽然现代单目几何基础模型已能实现极高的单图预测精度,但在处理连续输入时,它们往往表现出严重的时间不一致性,尤其表现为显著的尺度-偏移漂移(scale–shift drifting)。

通过针对性的经验分析,我们将这种不稳定性追溯到了其根源:潜特征统计量(latent feature statistics)的波动,其均值和方差直接决定了预测深度的尺度与偏移。 基于这一发现,我们引入了 动态特征归一化(Dynamic Feature Normalization, DyFN)。这是一个轻量化的因果循环模块(causal recurrent module),能够动态且稳健地调节特征统计量,从而在时间维度上维持稳定的几何表现。我们通过仅微调 DyFN 模块(仅增加 2% 的额外参数),在保持主干网络冻结的情况下,使强大的预训练单目几何模型适配于流式任务,从而在不损害单图精度的前提下实现了时间一致性。

在四个基准测试上的广泛实验表明,DyFN 有效消除了断层现象(disjointed layering)和位置抖动(positional jitter)等时间伪影,达到了最先进的时间稳定性,相比之前的流式处理方法提升高达 14%,甚至优于参数量更大的非因果视频基准模型。

Talk大纲

1. 介绍深度估计任务

2. 深度估计存在的问题

3. 我们的发现

4. 动态特征归一化

5. 效果

Talk·预习资料

打开网易新闻 查看精彩图片

项目主页:https://articraft3d.github.io/

打开网易新闻 查看精彩图片

Stabilizing Streaming Video Geometry via Dynamic Feature Normalizatio(CVPR 2026 poster) 论文链接: https://drive.google.com/drive/folders/1eOMUETMxKAB_CWAmZLZQv_8uef86V56K

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

打开网易新闻 查看精彩图片

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

打开网易新闻 查看精彩图片

吕晓阳

香港大学·博士生

吕晓阳 (Xiaoyang Lyu),香港大学 CVMI 实验室的四年级博士生,导师为齐晓娟 (Xiaojuan Qi) 教授。目前,正在剑桥大学进行访问学习,由 Shangzhe (Elliott) Wu 教授指导。

吕晓阳的研究愿景是致力于缩小物理世界与数字世界之间的差距,通过在模拟器中复制复杂的物理特性、几何结构和材料属性来实现这一目标。他坚信,高保真世界建模 (High-fidelity world modeling) 是推进具身智能 (Embodied AI) 并创造出真正对现实世界有益的智能体的关键。 虽然他之前的工作主要集中在基于规则和前馈的重建与渲染,但目前正在探索大规模生成模型与缩放定律 (Scaling laws) 如何能够彻底变革传统的计算机视觉任务。他的目标是构建稳健的 3D 流水线与生成能力之间的协同效应,即利用传统方法确保物理上的准确性,同时借助生成模型来提升智能的规模。

个人主页: https://www.techbeat.net/grzytrkj?id=14873 https://shawlyu.github.io

报名截止至 5 月 19 日晚 8 点,席位有限~

-The End-

如果你也想成为讲者

自荐 / 推荐

单人Talk | 团队专场 | 录播or直播 | 闭门交流

多种方式任你选择!

推荐讲者成功也有奖励哦~

关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>

预约本期Talk