Talk预告｜北京航空航天大学阮受炜：探索视觉感知的3D视角鲁棒性

将门创投

2024-09-24 08:25 ·北京 ·优质互联网领域创作者

本期为TechBeat人工智能社区第626期线上Talk。

北京时间9月25日(周三)20:00，北京航空航天大学博士生阮受炜的Talk将准时在TechBeat人工智能社区开播！

他与大家分享的主题是:“探索视觉感知的3D视角鲁棒性”，届时他探索和思考如何有效评估、增强视觉感知模型应对视角变换的鲁棒性，介绍团队在这一领域开展的系列工作，包括ViewFool、VIAT和Omniview-Tuning。

Talk·信息

主题：探索视觉感知的3D视角鲁棒性

嘉宾：北京航空航天大学 · 博士生 - 阮受炜

时间：北京时间9月25日(周三)20:00

地点：TechBeat人工智能社区

http://www.techbeat.net/

Talk·介绍

获得鲁棒和不变（Invariant）的表征是计算机视觉领域的长期挑战。以往的深度学习鲁棒性研究侧重于针对L-p范数下的对抗扰动（Adversarial perturbation）。然而在复杂动态的物理场景下，存在诸多值得关注的自然扰动，而视角变换就是其中一种重要的扰动因素。

在本次分享中，我们将一起探索和思考如何有效评估、增强视觉感知模型应对视角变换的鲁棒性，介绍我们在这一领域开展的系列工作，包括ViewFool、VIAT和Omniview-Tuning。

Talk大纲

1. 引言—视觉感知中的视角鲁棒性问题

2. 有限视图下的视角鲁棒性评估算法

ViewFool: Evaluating the Robustness of Visual Recognition to Adversarial Viewpoints, NeurIPS2022

3. 视角不变性对抗分布训练

VIAT: Towards viewpoint-invariant visual recognition via adversarial training, ICCV2023

4. 迈向视觉-语言预训练模型的视角鲁棒性增强

Omniview-Tuning: Boosting Viewpoint Invariance of Vision-Language Pre-training Models, ECCV2024 Oral

5. 工作局限性与未来展望

Talk·预习资料

论文链接： https://arxiv.org/abs/1811.11553

论文链接： https://arxiv.org/abs/2210.03895 代码链接： https://github.com/Heathcliff-saku/ViewFool_

论文链接： https://arxiv.org/abs/2307.10235 代码链接： https://github.com/Heathcliff-saku/VIAT

论文链接： https://arxiv.org/abs/2404.12139 代码链接： https://omniview-tuning.github.io/

Talk·提问交流

在Talk界面下的【交流区】参与互动！留下你的打call和问题，和更多小伙伴们共同讨论，被讲者直接翻牌解答！

你的每一次贡献，我们都会给予你相应的i豆积分，还会有惊喜奖励哦！

Talk·嘉宾介绍

阮受炜‍‍‍‍‍‍‍‍‍

北京航空航天大学 · 博士生

阮受炜是北京航空航天大学二年级直博生，导师为韦星星副教授。同时在清华大学作为访问博士生，在苏航研究员、董胤蓬博士指导下开展相关研究。他先前本科毕业于西安电子科技大学。他的研究兴趣集中在3D视觉感知及其鲁棒性。在CVPR/ICCV/ECCV等国际顶级会议发表论文6篇，其中1篇工作入选ECCV2024Oral。

个人主页: https://www.techbeat.net/grzytrkj?id=41658

-The End-

如果你也想成为讲者

自荐 / 推荐

单人Talk | 团队专场 | 录播or直播 | 闭门交流

多种方式任你选择！

推荐讲者成功也有奖励哦~

关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投，是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验，加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地，分享自己最新工作的沃土，在AI进阶之路上的升级打怪的根据地！

更多详细介绍>>

预约本期Talk

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴