2024年11月23日,2024年CAAI-PR模式识别专家讲坛“大模型时代下模式识别的深度发展”将在桂林电子科技大学举办。诚邀模式识别、计算机视觉、人工智能、计算机应用技术领域专业人士,研究生及其他感兴趣者参加。

会议议程

时间:2024年11月23日 9:00-12:10

地点:桂林电子科技大学花江校区慧谷1号楼106会议室

主办单位:中国人工智能学会

承办单位:CAAI 模式识别专委会、桂林电子科技大学计算机与信息安全学院、广西图像图形与智能处理重点实验室、广西可信软件重点实验室

论坛本地主席

文益民(桂林电子科技大学)

蔡国永(桂林电子科技大学)

蓝如师(桂林电子科技大学)

日程一览

打开网易新闻 查看精彩图片

报告信息

打开网易新闻 查看精彩图片

周杰

清华大学自动化系长聘教授

全国重点实验室主任

国家杰出青年科学基金获得者

国家基金委创新研究群体学术带头人

IAPR/CAA Fellow

报告题目:面向无人系统的视觉感知

报告摘要:

无人系统是人工智能的重要研究领域,也是我国乃至全球重点发展的产业方向。由于应用任务的多样性和环境的复杂性,无人系统中的视觉感知面临着很多特殊挑战。本报告将分享作者对无人系统中视觉感知的理解,讨论需要重点解决的学术问题,还将介绍清华大学自动化系智能视觉实验室的相关研究。

个人简介:

曾任清华大学副教务长、研究生院院长、国家卓越工程师学院执行院长、校学位评定委员会副主席、自动化系主任、自动化与工业工程大类首席教授等。现兼任教育部高等学校自动化类专业教学指导委员会主任委员、中国学位与研究生教育学会秘书长、国务院学位委员会学科评议组成员兼控制科学与工程评议组秘书长、中国人工智能学会模式识别专委会主任、人工智能顶刊《IEEE T-PAMI》编委(Associate Editor)、《模式识别与人工智能》副主编等。长期从事模式识别与计算机视觉的学术研究,发表IEEE期刊论文100多篇,其中IEEE T-PAMI长文35篇。以第一完成人获国家技术发明二等奖、中国专利银奖等奖励,指导6名博士生获得全国优秀博士论文提名奖、中国人工智能学会优秀博士论文、中国图像图形学会优秀博士论文。

打开网易新闻 查看精彩图片

桑农

华中科技大学人工智能与自动化学院教授

报告题目:运动增强长-短期对比学习的小样本行为识别

报告摘要:

视频人体行为分析技术在视频监控、人机交互、文化娱乐、体育健身等多个领域具有广泛的应用前景。但对于某些特定应用,比如监控视频中异常行为的识别,往往难以获得足够的样本用于行为分析模型的训练,需要引入小样本学习技术,研究小样本条件下的行为识别问题。现有的小样本行为识别方法均未显式考虑时序上下文信息,忽略了显式运动信息的提取,因而影响到小样本条件下行为识别的性能。本报告介绍了我们提出的运动增强长-短期对比学习小样本行为识别网络,通过提取具有全局信息感知能力的帧级特征,以及具有运动信息感知能力的帧差特征,有效提升了小样本条件下的行为识别性能。

个人简介:

从事计算机视觉和模式识别等方面的研究。中国图象图形学学会理事,中国人工智能学会理事,中国图象图形学学会成像探测与感知专业委员会副主任委员,中国人工智能学会模式识别专业委员会常务委员,中国自动化学会模式识别与机器智能专业委员会常务委员。作为项目负责人先后承担了国家自然科学基金重点与面上项目、863计划项目、高分辨率对地观测系统重大专项项目等国家与省部级课题30余项的研究,在IEEE T-PAMI、IJCV、IEEE T-IP、IEEE-TMM、IEEE-TCSVT、IEEE T-Cybernetics、Pattern Recognition、CVPR、ICCV、ECCV、NeurIPS、AAAI等期刊及会议发表论文70余篇,获省部级一等奖6项,二等奖5项,三等奖2项。

打开网易新闻 查看精彩图片

王树徽

中科院计算所研究员

报告题目:扁平学习

报告摘要:

深度学习已取得巨大成功,然其并非模拟人脑机制的最优方式。本报告从神经元连接建模角度出发,阐述了如何从哈密顿动力学视角将神经元作用关系用路径积分进行建模,提出了扁平学习这一神经计算系统的规模化构建思想,由此出发提出了深度学习->扁平学习的异构模型转换方法,并在语言、视觉、图等数据模态上尝试实现了扁平模型的训练,进一步将该思想应用到基础模型的参数微调任务中。最后结合已取得的初步进展,对该理论框架的未来发展进行探讨。

个人简介:

从事计算机视觉、多媒体分析、机器学习等方向研究,提出了扁平化神经计算、可信多模态学习等理论方法框架,在人工智能领域顶级期刊和会议论文110余篇,申请专利20余项、合作撰写译著1本;担任多个国际顶级会议的领域主席和领域内重要期刊的编委会成员或客座编委,在高水平国际会议上组织了多次学术专题研讨会和学科竞赛;承担科技部重点研发项目课题、基金委优秀青年科学基金等十余项国家级/省部级项目,作为子课题负责人或技术骨干参与科技创新2030-新一代人工智能重大项目、973课题、863项目/课题的研究工作,参与完成了“中国人工智能2.0发展战略研究”中“跨媒体智能”部分内容撰写;获得吴文俊人工智能自然科学一等奖、北京市科技进步二等奖、全国多媒体大会最佳论文奖、领跑者5000(F5000)中国精品科技期刊顶尖学术论文等奖励,研究成果在智能制造、辅助设计、网络内容服务、视频分析等场景中得到验证和应用。

打开网易新闻 查看精彩图片

唐彦嵩

清华大学深圳国际研究生院特聘研究员

报告题目:高能效扩散模型及其应用

报告摘要:

随着扩散模型的出现,视觉生成模型领域迎来了前所未有的发展机遇。扩散模型通过迭代式的去噪过程及其对文本等多模态信息的交互理解能力,实现了在生成质量和用户可控性方面的新突破。然而,扩散模型庞大的模型体量及长时间的迭代效率带来了高昂的推理成本,限制了其在低能耗设备上的应用场景。本次报告将围绕上述问题,重点介绍团队近期针对扩散模型结构设计的模型压缩及高效推理方案,以及其在图象增强、人体姿态估计以及动作生成等方面的应用。

个人简介:

广东省杰出青年基金获得者。分别在清华大学自动化系获得工学学士和博士学位,在英国牛津大学从事博士后工作,并先后在美国加州大学洛杉矶分校和微软亚洲研究院进行访问研究。主要从事人工智能与计算机视觉等领域的相关工作,在国际权威期刊和会议上发表论文40余篇,主持国家重点研发计划课题等国家级项目,入选第八届中国科协青年人才托举工程和微软亚洲研究院“铸星计划”,担任国际顶会CVPR领域主席、国际期刊JVCIR编委以及中国人工智能学会模式识别专业委员会(CAAI-PR)常务委员兼副秘书长等学术职务。

本文由CAAI 模式识别专委会供稿