本期为TechBeat人工智能社区711线上Talk。

北京时间8月21日(周四) 20:00,深圳北理莫斯科大学长聘副教授曾润浩的Talk将准时在TechBeat人工智能社区开播!

他与大家分享的主题是:“直播高光秒捕捉 - 一句话、一张图、一段视频精准锁定”,届时他将解释一种基于混合模态查询的线视频定位任务:在视频直播时,能根据你输入的一句话、一张图或一小段参考视频,实时找到匹配的感兴趣片段。

Talk·信息

主题:直播高光秒捕捉 - 一句话、一张图、一段视频精准锁定

嘉宾:深圳北理莫斯科大学 · 长聘副教授 - 曾润浩

时间:北京时间8月21日(周四) 20:00

地点:TechBeat人工智能社区

http://www.techbeat.net/

Talk·介绍

视频感兴趣内容定位旨在根据用户输入的查询(query)在长视频里找对应片段。传统方法存在两个局限:只能处理文本查询,只能针对离线视频进行分析。 本文提出基于混合模态查询的线视频定位任务:在视频直播时,能根据你输入的一句话、一张图或一小段参考视频,实时找到匹配的、感兴趣的片段。 为此构建了数据集和新指标,并设计了相应的基线模型。

Talk大纲

1. 背景与任务动机:离线单模态Video Grounding局限

2. 新方法:参数化记忆+跨模态蒸馏

3. 新数据集、新指标:QVHighlights-Unify+在线指标

4. 实验结果:精度与速度分析

5. 总结:统一多模态实时定位

Talk·预习资料

打开网易新闻 查看精彩图片

论文链接: https://arxiv.org/abs/2004.03545

打开网易新闻 查看精彩图片

论文链接: https://arxiv.org/abs/2508.11903

打开网易新闻 查看精彩图片

论文链接: https://arxiv.org/abs/2308.07102

打开网易新闻 查看精彩图片

论文链接: https://arxiv.org/abs/2508.04546

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

打开网易新闻 查看精彩图片

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

打开网易新闻 查看精彩图片

曾润浩‍‍‍‍‍‍‍‍‍‍‍

深圳北理莫斯科大学 · 长聘副教授
‍‍‍

曾润浩,博士,深圳北理莫斯科大学长聘副教授,北理工博导。广东省重大人才工程青年拔尖人才,深圳市科技创新人才,深圳市鹏城孔雀人才,广东潮博智库专家。研究领域为计算机视觉、多模态数据分析,核心方向包括视频动作识别、情绪识别等,在IEEE TPAMI、IEEE TIP、CVPR等国际顶级期刊和会议发表论文30余篇,谷歌学术总引2000余次,单篇最高引600余次。所提出的视频时序动作分析方法在THUMOS14权威基准连续14个月排名全球第一。近三年主持国家自然科学基金项目、广东省教育厅重点领域项目等纵向科研项目7项。获教育部自然科学二等奖,中国图象图形学学会优博提名奖,IEEE计算机学会杰出组织奖,成果入选CVPR 2024最佳论文Final List。受邀担任NeurIPS、CVPR等人工智能领域顶级会议和TPAMI、TIP等权威期刊的程序委员会委员和审稿人。担任国际会议2024 IEEE SmartIoT本地主席、2023 CSIG青年科学家会议论坛主席,2025 VALSE人体动作理解与生成论坛主席,CSIG多媒体专委会委员,广东图象图形学会青工委委员,计算机视觉专委会委员。

个人主页: https://www.techbeat.net/grzytrkj?id=45440 ‍‍‍‍

-The End-

打开网易新闻 查看精彩图片

如果你也想成为讲者

自荐 / 推荐

单人Talk | 团队专场 | 录播or直播 | 闭门交流

多种方式任你选择!

推荐讲者成功也有奖励哦~

关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>

预约本期Talk