来源:市场资讯
(来源:中国图像图形学会CSIG)
中国图像图形学会博士/硕士学位论文激励计划旨在推动中国图像图形学领域的科技进步,鼓励创新性研究,促进青年人才成长。
为宣传科技工作者积极进取的工作精神,分享获奖人的科研故事,本期推文我们独家对话2025年度CSIG硕士学位论文激励计划入选者孙智敏,听他讲述科研路上的坚守与成长,以榜样之力,赴创新之约。
问题一:感谢您接受CSIG专访,请先进行一下自我介绍:
大家好,我是孙智敏,2025年从上海交大计算机系硕士毕业,现在腾讯广告做算法工程师,主要负责腾讯广告妙思和微信小店的电商AI海报生成。读研期间跟着易冉老师做deepfake检测和可控生成,在IJCV、ICCV、CVPR这些顶刊顶会发过几篇一作论文,也拿过国家奖学金。很荣幸能入选今年的CSIG硕士论文激励计划提名。
问题二:在科研过程中,有没有什么好的方法可以推荐给大家?
分享三个我觉得挺实用的经验吧:
第一,别脱离实际问题。 我当时选deepfake这个方向,就是看到网上假脸泛滥,觉得这是个真痛点,不是为了追热点而做。
第二,跑实验要快。 想法对不对,赶紧写代码验证,别憋大招。我刚开始也走了不少弯路,但快速试错才能及时调整。
第三,多跟人聊。 我那个多感知投票模块的灵感,其实是组会上大家闲聊"人眼怎么看真假"时冒出来的。有时候跨领域的讨论特别能启发思路。
问题三:请对您的论文进行简要介绍:
我的论文针对开放世界深度伪造溯源这一新挑战,提出了OW-DFA++基准和多视角感知学习(MPSL)框架。
核心创新有两点:一是多感知投票模块,从全局、局部、频率三个视角对齐伪造痕迹特征;二是自适应置信度伪标记策略,解决新型攻击带来的伪标签噪声问题。该方法在应对GAN、身份交换、扩散模型等多元攻击时展现出优异的溯源能力和泛化性,为深度伪造检测安全提供了新的技术路径。
问题四:请问您在论文筹备过程中遇到最大的挑战是什么?是怎样克服的呢?
最头疼的是数据太杂、标注太少。网上扒下来的假脸五花八门,新型攻击层出不穷,但很多数据没标签,没法直接拿来训练。
我们是怎么解决的呢?一方面让模型学会从多个角度看图,不依赖某一种伪造特征;另一方面用半监督学习,让模型自己挑置信度高的样本打伪标签,慢慢扩展能力边界。这个迭代了好多轮,每次失败都让我们更清楚"开放世界"到底难在哪儿。
问题五:请问您有什么获奖感言呢?
特别感谢CSIG的认可!
首先要感谢易冉老师,从选题到实验卡壳,总能一针见血地指出问题,让我少走很多弯路。也感谢实验室的兄弟们,那些一起熬夜debug、争得面红耳赤的日子很难忘。还要感谢腾讯优图的各位老师以及我的mentor,让我看到学术落地产品的价值。
这个奖对我来说是个新起点。deepfake和AIGC的攻防战还在继续,我会继续在这个方向深耕,争取做出更有用的工作。
热门跟贴