近日,NeurIPS 2024大会揭晓了最佳论文奖名单,其中,曾因涉嫌恶意攻击字节跳动训练集群的实习生田柯宇与其团队合作的论文脱颖而出,荣获该殊荣。这篇论文不仅是田柯宇在字节商业化技术部门实习期间的重要成果,还获得了NeurIPS 2024第六高分(7,8,8,8)。
据了解,田柯宇的这篇获奖论文是国内第二篇NeurIPS Best Paper,含金量极高。此前,他已有多篇论文在顶级会议上发表,包括ICLR 2023的Spotlight论文「Designing BERT for Convolutional Networks: Sparse and Hierarchical Masked Modeling」,以及NeurIPS 2021和2020、ECCV 2020的Poster论文。
然而,田柯宇的学术成就曾因一起恶意攻击事件蒙上阴影。两个月前,有消息称他在字节跳动实习期间,因对团队不满,利用Huggingface的load ckpt函数漏洞,向模型训练中注入恶意代码,导致模型训练出现问题。该事件一度引起轩然大波,网友纷纷表示震惊和不解。
面对指责,田柯宇曾否认自己与此事有关,称自己在发完论文后已离职,是另一人钻了漏洞并嫁祸于他。然而,一个多月后,事件迎来反转,字节跳动正式向法院起诉田柯宇,要求其赔偿侵权损失800万元及合理支出2万元,并公开赔礼道歉。法院最终判令田柯宇承担相应责任。字节官方澄清称,此次事件仅影响了团队研究项目,并未波及商业化正式项目或大模型等其他业务。
据悉,田柯宇本科毕业于北航软件学院,研究生就读于北京大学,师从王立威教授,研究方向为深度学习的优化与算法。自2021年起,他在字节跳动实习研究,涉及超参数优化、强化学习算法、自监督的新型算法等多个领域。(来源:新智元)
热门跟贴