导语
2021年新加坡最高荣誉——总统科学技术奖(PSTA)近期颁布,新加坡南洋理工大学张含望教授因其使用群论构建人工智能通用因果框架的工作而获得总统技术奖(YSA)。该框架可以干预环境、按需收集数据,并生成虚拟数据。此研究对于减少大数据样本量依赖的下一代人工智能至关重要,在不牺牲性能的情况下降低模型训练的能源成本。
本次邀请到了张含望教授团队介绍最新的基于群论的自监督特征解耦框架,以及该框架作为一种对因果理论的深层解释如何与下游的因果推理任务相结合。
背景
当今机器学习,尤其是深度学习主要依赖数据驱动以及关联学习,导致了学习到的模型普遍存在着黑盒特性以及有偏预测等问题。因此,最近的研究者致力于将因果推断引入机器学习,进而实现模型的鲁棒性和可解释性。然而,与因果理论广泛运用的传统统计学、社会学等领域不同,深度学习领域所使用的主要“原料”—— 特征,具有高维性、连续性、耦合性等特点,阻碍了传统因果推断理论的直接应用。例如,在经典的辛普森悖论(运动量-胆固醇-年龄)中,所观测到的变量之间本就是天然解耦的;而在主流的深度学习领域,如图片识别中,经过网络得到的特征大多是成百上千维的,且各类信息都混杂其中。这也直接导致了因果推断理论的应用困难。
本次报告将切换视角,回溯因果推断的上游,探寻如何搭建一个基于群论的解耦特征学习框架,以实现自监督的特征解耦,进而为后续的深度学习领域的因果推断研究提供帮助。另一方面,群论中暗藏的“变”与“不变”可以对下游因果推断进行进一步解释,成为机器鲁棒性学习的基础而有力的工具。
内容简介
因果关系追求的是亘古不变的道理。而想要从繁复的自然观察中获取不变性,至少要先能拆分(disentangle)出来“变”与“不变”。如果不能拆分,因果推理就只是空中楼阁。传统金融乃至社会学领域中,变量(人口、年龄、性别等)本身就是互相解耦(disentangle)的,因此并不存在这一问题;但是在深度学习领域,常用的特征(representation)中各个语义信息却是混杂在一起的,使得因果理论并不能得到完全的应用。
此次报告将介绍我们最新的基于群论的自监督特征解耦框架IP-IRM。其利用抽象代数的群论来建模数据之间的变化,结合数据分组、对比学习以及不变性约束来达到解耦特定语义的目标。另一方面,我们将举例介绍该解耦框架如何与现有的因果推理方法相结合,在下游多种泛化性任务中取得鲁棒的效果,以及群论如何作为一种底层工具用于对因果理论进行更深层的解释。同时,我们还将与大家一同讨论未来特征解耦与因果推断的可能融合方向,让深度学习时代的因果推断发挥更大的作用。
主讲人
张含望博士,新加坡南洋理工大学“南洋”荣誉助理教授,荣获“南洋”学者经费资助,荣获新加坡最高荣誉“总统技术奖”。他于2009年在浙江大学取得学士学位,并在2014年在新加坡国立大学取得了博士学位,之后在新加坡国立大学和美国哥伦比亚大学从事研究工作。张博士的主要研究领域是多模态当中的计算机视觉和机器推理。张博士曾经获得ACM MM 2013的最佳学生论文,ACM SIGIR 2016的最佳论文提名奖,以及TOMM 2018和IEEE TMM 2020的最佳论文, IEEE AI’s 10 to watch。其团队获得Visual Dialog Challenge 2018, 2020亚军以及2019冠军。
王谭,新加坡南洋理工大学博士生,MReaL实验室成员。主要研究方向为视觉问题中的因果推断、无监督表征学习等。主要研究已发表在CVPR, ICCV, NeurIPS, TNNLS等会议和期刊。
直播信息
时间:
2022年1月2日上午9: 00-11: 00
文末扫码参加 ,加入群聊,获取系列读书会回看权限,成为因果社区种子用户,与900余位社区的科研工作者沟通交流,共同推动因果科学的发展。
集智俱乐部 B 站免费直播,扫码可预约。
扫码预约
因果科学读书会第三季启动
由智源社区、集智俱乐部联合举办的 ,将主要面向两类人群:如果你从事计算机相关方向研究,希望为不同领域引入新的计算方法,通过大数据、新算法得到新成果,可以通过读书会各个领域的核心因果问题介绍和论文推荐快速入手;如果你从事其他理工科或人文社科领域研究,也可以通过所属领域的因果研究综述介绍和研讨已有工作的示例代码,在自己的研究中快速开始尝试部署结合因果的算法。读书自2021年10月24日开始,每周日上午 9:00-11:00举办,持续时间预计 2-3 个月。
读书会大纲一览:
Donald Rubin:Essential Concepts of causal inference
「基础理论学习」
因果推断的潜在结果框架在实验性研究的应用
因果推断在观察性研究中的应用:DESIGN
因果推断在观察性研究中的应用(续):ANALYSIS
「案例研讨」
医学、药学、生物学中的研究案例
管理学、经济学、社会学及政治学中的研究案例
因果随机森林及其在工业界的应用
多级治疗与连续性暴露
因果推荐系统
因果在自然语言处理中的应用
因果与公平性和可解释性
「深入理论学习」
双稳健估计、处理极端倾向得分的方法
阴性对照试验
高维因果推断
结合随机化试验数据与观察性数据
热门跟贴