本期为TechBeat人工智能社区626线上Talk。

北京时间9月25日(周三)20:00,北京航空航天大学博士生阮受炜的Talk将准时在TechBeat人工智能社区开播!

他与大家分享的主题是:探索视觉感知的3D视角鲁棒性,届时他探索和思考如何有效评估、增强视觉感知模型应对视角变换的鲁棒性,介绍团队在这一领域开展的系列工作,包括ViewFool、VIAT和Omniview-Tuning。

Talk·信息

主题:探索视觉感知的3D视角鲁棒性

嘉宾:北京航空航天大学 · 博士生 - 阮受炜

时间:北京时间9月25日(周三)20:00

地点:TechBeat人工智能社区

http://www.techbeat.net/

Talk·介绍

获得鲁棒和不变(Invariant)的表征是计算机视觉领域的长期挑战。以往的深度学习鲁棒性研究侧重于针对L-p范数下的对抗扰动(Adversarial perturbation)。然而在复杂动态的物理场景下,存在诸多值得关注的自然扰动,而视角变换就是其中一种重要的扰动因素。

在本次分享中,我们将一起探索和思考如何有效评估、增强视觉感知模型应对视角变换的鲁棒性,介绍我们在这一领域开展的系列工作,包括ViewFool、VIAT和Omniview-Tuning。

Talk大纲

1. 引言—视觉感知中的视角鲁棒性问题

2. 有限视图下的视角鲁棒性评估算法

ViewFool: Evaluating the Robustness of Visual Recognition to Adversarial Viewpoints, NeurIPS2022

3. 视角不变性对抗分布训练

VIAT: Towards viewpoint-invariant visual recognition via adversarial training, ICCV2023

4. 迈向视觉-语言预训练模型的视角鲁棒性增强

Omniview-Tuning: Boosting Viewpoint Invariance of Vision-Language Pre-training Models, ECCV2024 Oral

5. 工作局限性与未来展望

Talk·预习资料

论文链接: https://arxiv.org/abs/1811.11553

论文链接: https://arxiv.org/abs/2210.03895 代码链接: https://github.com/Heathcliff-saku/ViewFool_

论文链接: https://arxiv.org/abs/2307.10235 代码链接: https://github.com/Heathcliff-saku/VIAT

论文链接: https://arxiv.org/abs/2404.12139 代码链接: https://omniview-tuning.github.io/


Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

阮受炜‍‍‍‍‍‍‍‍‍

北京航空航天大学 · 博士生

阮受炜是北京航空航天大学二年级直博生,导师为韦星星副教授。同时在清华大学作为访问博士生,在苏航研究员、董胤蓬博士指导下开展相关研究。他先前本科毕业于西安电子科技大学。他的研究兴趣集中在3D视觉感知及其鲁棒性。在CVPR/ICCV/ECCV等国际顶级会议发表论文6篇,其中1篇工作入选ECCV2024Oral。

个人主页: https://www.techbeat.net/grzytrkj?id=41658

-The End-

如果你也想成为讲者

自荐 / 推荐

单人Talk | 团队专场 | 录播or直播 | 闭门交流

多种方式任你选择!

推荐讲者成功也有奖励哦~

关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>

预约本期Talk