好家伙!NeruIPS前线来报:华人学子们被人从众包围了!

打开网易新闻 查看精彩图片

今年NeurIPS好不热闹,165000名参会者创下新纪录,一众大佬出来展示成果、分享观点。

与此同时,一些新生代面孔也开始崭露头角。

他们亮相于各路最佳/杰出论文颁奖现场、海报展示、WorkShop上。

海报前被人山人海包围的00后小姐姐,是刚上大四就发了NeurIPS一作的程楚欣

打开网易新闻 查看精彩图片

还有正在麦吉尔大学读博一的余淏,他参与的多篇论文都被顶会收录了,而且还是Kaggle平台专家级别。

另外还包括来自MIT的李罗罗,在pika实习期间,学习生成式视频领域,更是因为工作中需要微调多个模型以适应不同分布要求的情况下,如何选择合适的参数高效方法。

这一问题促使她与南京大学、上海交通大学、腾讯以及MIT等国内外知名机构合作,共同撰写了一篇论文。在论文中,他们提出了一个统一的视觉参数效率测试基准(V-PETL Bench),旨在解决这一难题。

而巧合的是,这群人还都在腾讯青云计划群星未来之夜上相聚了。他们也有一个共同的身份——腾讯星火计划 “星友”

对了,听说大会今年新增了高中生赛道,有我们国内学子独立撰写的论文还获得了Spotlight

来自上海星河湾双语学校的陈天睿,据悉也是今年星火计划的新学员,他做出了一个大型多模态模型(LMM)的智能体系统,用于精确地理定位和验证的AI Agent「只需随意拍一张照片,就能得判断这张图片是在哪里拍的」,产品已经到了可用阶段。

Okk,我们的前方盆友也趁机同他们展开了深度交流,以下为详情内容。

新生面孔NeurIPS崭露头角

程楚欣:大四即发NeurIPS一作

程楚欣,一位加州理工学院计算机科学专业就读的大四学生,导师为岳毅松教授和亚当・维尔曼教授。

该论文提出了一种基于后验采样的贝叶斯算法执行方法,用于解决函数评估成本问题。

打开网易新闻 查看精彩图片

许多现实问题可归结为估计黑箱函数的属性,但函数评估成本高,现有贝叶斯算法执行(BAX)方法依赖期望信息增益(EIG)选择评估点,计算成本高,尤其在高维问题或属性复杂时。而该算法基于后验采样,每次迭代只运行一次基础算法,速度快且简单,在多个任务中表现出高效性和竞争力。

贝叶斯优化的核心思想是利用贝叶斯定理将不确定性转化为概率分布,从而在有限的计算资源下找到最优解。

而程楚欣所在的团队,所做的事情相当于将原来的算法推广到不光是找到它的最优解,还可以找到它最优的十个解。在已知一个有效算法的前提下,通过后验采样的方式,找到函数的任何一个性质,主要这个性质是一种可以被算法算出来的。

如此,这样的优化本身就带有很强的应用属性。比如很多生物学家、化学家他们自己有一套成熟的模型,这个算法能帮助他们更有效率地利用已有的模型。在蛋白预测、药物研发等方面,可以加速实验的进程、提升研发效率。

回顾她的研究经历,除了她在贝叶斯优化这个领域有过多篇成果之外,她也向我们透露,期间她曾涉足诸多方向,包括图神经网络、conformal prediction保形预测,也做过一些机器人、控制系统等等。

甚至有段时间里,她的状态就是只要有研究可以做,她就愿意去跟着做。只不过后来精力太过分散,没办法一下子兼顾很多东西。

因此像现在这种有Paper出来,她也谦虚道:是有点运气成分在里面的

如今她正在申请博士,主要关注的领域是 AI For Science,利用AI去帮助科研发现。Science这个领域还有很多问题是AI可以发挥优势的地方。

此外,她也非常看看重基础学科,尤其是应用数学在AI未来发展中的重要性。这其实也是她一直以来的热爱。

参加星火计划前,“我从未想到我会和计算机专业有什么联系”。参加之后,发现机器学习“挺好玩的”

打开网易新闻 查看精彩图片

当时19岁的程同学刚收到了加州理工学院的offer,一心想的还是选择数学

2021年她以数学特长加入到了腾讯星火计划挑战周——量子方向,在为期5天时间里,作为一位“不怎么会写代码”的菜鸟新手,主要负责量子背后的数学原理部分。代码的部分“交给队友”。

也正是这个过程,让她产生了对计算机科学的兴趣,在确认专业时,选择了计算机科学,并在后面的星火超新星以赛代培的模式中,先后与当时的队友余淏和其他星火小伙伴组队打了各种Kaggle比赛,在CV、NLP多领域打下了很好的基础。在这个过程中训练到了“交叉思维”—— 数学与计算机的交叉、研究与产业界的交叉。

余淏:脚踏实地,行稳致远

作为第二次参加NeurIPS的余淏,目前在麦吉尔大学和Mila读研一,从大三开始一直便在Mila实验室(由深度学习先驱Yoshua Bengio教授领导)参与各项研究。

谈及近况,他表示正跟着新导师David Adelani做小语种和多语种相关的项目。另外,他还在加拿大AI研究机构Vector Institute(Geoffrey Hinton为其首席科学顾问)担任助教,参与企业RAG的培训。

在星火计划的腾讯业务场景上,他参与改进了一种基于扩散模型的时间序列控制方法,并用于游戏市场数据分析任务中;能够实时基于游戏专家的判断进行数据调整,通过生成式方法实现更快更准的游戏数据的校准和预测,在游戏运营、发行等阶段能提供相当程度的业务价值。

打开网易新闻 查看精彩图片

今年来到NeurIPS,他(非一作)和团队带来了一篇利用多智能体模拟工具,模拟线上社交行为来探索虚假信息的传播路径和影响。具体而言,他们结合了Concordia框架和自建Mastodon社交媒体平台,提高模拟速度和信息流动,并设置了一系列测量工具。

打开网易新闻 查看精彩图片

从过往研究经历来看,他似乎始终在探索前沿技术,包括分子预测、量子线路模拟、RAG、扩散模型等等。而这最终也让他成为“会议达人”(2023年EMNLP共一作、2024年COLM二作、2024年EMNLP Shared Task Wining in NER…),并进一步加深了他对NLP的热情和对AI的探索。

而让他能够自由探索各种感兴趣方向的支持来源,也包括星火计划。原因也很简单,这让他能在学生阶段就有机会接触产业界的问题和真实数据。按他的话说,

只有尽早进入某一领域,并长期在前辈指导下不断积累,未来才有可能引领这一领域。

而就在他和程楚欣参加完挑战周之后,他就主动联系星火计划项目组寻求赛事参与的支持(组队、找导师),甚至从0自学到带领小伙伴们拿下多个奖牌。

对了悄咪咪透露,也是他最早启发腾讯设计“以赛代培”“以战代培”的”星火”模式。

打开网易新闻 查看精彩图片

值得一提的是,他在星火计划超新星期间的导师,来自腾讯IEGG Advanced Data Group的数据科学家童世炜对他独立解决问题的能力大加赞赏。在超新星培养期间,也产出一篇RAG Evaluation: A Survey论文被2024CCF Big Data(国内大数据领域最具影响力、规模最大的学术会议之一)收录。

总之据他透露,正是星火的这种项目制让他得以早期高频参加各种知名赛事,从而提前积累了大量的经验和技能,为未来的研究和工作打下了坚实的基础。

聊到最后,他表示接下来的重点在于探索如何更高效的利用人类知识和行为反馈来训练模型,以及RAG的进一步改进和工程落地。

借东风与些许运气,在lab中学习;进步无法比肩同届大佬,唯愿诸君扶摇直上九万里! 我当脚踏实地、行稳致远,莫愁前路无知己,天下谁人不识君?

陈天睿:高中赛道SpotLight

今年NeurIPS专门设置了高中生赛道,结果有三名中国高中生的论文获得了Spotlight。

上海星河湾双语学校的陈天睿,就是一位。

他提出了用于精确地理定位和验证的多模态智能体,只需随意拍一张照片,就能得判断这张图片是在哪里拍的。

目前产品已经到了可用阶段。整个项目从想法到落地,全都是他一个人来完成。

比如在NeurIPS会场上拍一张,结果没有任何标识,仅凭借会议场景、PPT细节等就判断出这是在温哥华会议中心附近。

打开网易新闻 查看精彩图片

陈天睿透露,这个项目背后主要利用 LATS(Language Agent Tree Search ),也融入了 NeurIPS‘23 提出的 GeoClip,这一纯机器学习方式的最佳模型(SOTA)。

今年年初,他注意到多模态大模型才刚崭露头角,在此之前,很难有能直接应用的模型。恰在那时,看到了Geoclips出现,就想着可以借此解锁一个新的应用场景。

在此之前,几乎所有的研究都是运用一个模型,依据一张图片去猜测一个地理定位,判断上其实已经较为精准。

而陈天睿所做的,是在此基础上添加了一个类似GPT的模型,让GPT再进行一层判断。这样做的好处在于:比如图片里有一个地标或者有路名之类,GPT能够根据地标或路名在网上对应搜索到那条路。如此一来,精准度便会大幅提高。

这样,在大多数情况下,能够非常精确地找到定位,而非纯粹依靠机器学习的模型去猜测定位。

他坦言这个项目在算法上没有太多创新,更多是在工程和definition上做了一些改动——让大模型能接受文字和图片联众模态,而它调用的每个工具也能输出图片和文字。

之所以想到这个方向,是因为他平时就对AI与安全两个领域感兴趣——

五年级就开始学习编程。七年级,接触过一个跟扫描网络摄像头相关的开源项目,当时纯粹感觉好玩。十年级的时候,就开始尝试通过用网络摄像头进行地理位置定位。

另外受到学校里大火的GeoGuessr的游戏启发,希望做一个程序更加精准的通过图片识别地理定位,顺道写了一篇论文。

他特别提到了今年暑期参加的星火计划挑战周-安全方向

如果说在此之前,他主要是依照兴趣方向来进行相关的研究,那么在挑战周可以说是更有针对性、连续性地展开工作。项目全都是针对应用场景和业务场景,既涵盖攻击,也涉及防守

据介绍,今年挑战周的安全攻防方向分为攻击和防御两个阶段。在攻击阶段,学生需要逐步对办公网和生产网进行渗透,最终达成对目标ERP系统的数据窃取。

在防御阶段,同学们需要对攻击阶段产生的海量行为和流量数据进行清洗审查,以实现实时告警和响应系统。整个过程需要运用Elastic Search等工具展开数据分析和过滤,不仅尝试了传统的EDR和ND 规则,还创新性地运用 LLM 建立pipeline,提升了告警的有效性和精准度。

对此他坦言:“我之前主要学习如何攻击,并不知晓如何防守。星火挑战周的任务最终需要借助AI来识别和发现他人是如何攻击你的系统的,相当有趣,还结识了一群厉害的人。”

目前,陈天睿还在高中,未来面对升学,主要考虑CS、数据科学等专业。

星火同学不在少数

之所以对这些人的履历和经历,了解如此细致。

那是因为之前这些人,早就在大厂计划里曝光过了。

打开网易新闻 查看精彩图片

那就是堪称鹅厂最隐秘的人才培养计划,每年面向高中生招募五六十个不等,然后他们来到腾讯总部,与最顶尖的技术专家们共同解决产业中的实践难题。

如今已经办了五年,像程楚欣、余淏、陈天睿等有类似经历的星火童鞋不在少数,包括:

“乖神”邓明扬,也是在2021年,他作为IOI金牌第一名(全场唯一的满分600分)加入了星火,成为挑战周视频号推荐算法成员,再是2022年安全攻防方向的助教。

前面cue到的MIT李罗罗,作为当年MIT唯一录取的来自国内大陆高中的女生2023年作为星火挑战周的AIGC方向(线上助教),第一次接触工业界。

一个共同点是,都有过星火计划这段经历的他们,正在成为技术创新发展的中坚力量,不断产出优秀的成果。

而且正是因为那段经历,他们对技术在工业界的应用有了认知,在后续科研之路上,着重在各种交叉领域中,从解决实际问题出发,不拘泥于单一的研究方向。

其实,这种前沿领域交叉、理论与应用的汇聚也正在成为全技术领域的共识。

从技术角度来看,更多大模型进展受到基础学科的启发影响,比如像扩散模型受到物理热力学启发;还有一些图像生成受到电动力学的启发;更不用提数学如贝叶斯对于AI模型的影响了,这时候就需要学生具备多重学科交叉的思维。

如今大模型加速落地应用,同样也离不开基础技术的支撑,这一点在顶会上体现得越来越突出。

据与现场参与的专家交流,今年看到了很多大语言模型的应用。如果将时间往前倒个三五年,纯理论的研究可能还占据70%。

而随着理论逐渐落地工业界,类似星火计划这样用来打破学术界和工业界鸿沟的尝试无疑是大胆且有效的。

对此现场来自腾讯TEG的AI专家也提出建议:

对于本科生同学来说,提前接触工业界是非常有必要的。同学未来的发展方向是希望进入工业界的话,这个(指星火计划)还是很必要的。

除此之外我们看到,星火计划实际上还只是腾讯这家大厂更大体系的冰山一角。

打开网易新闻 查看精彩图片

在腾讯内部,它仅仅是一个更为普惠、更为体系化规范化的综合培养架构——腾讯青少年科创营地实训体系的一部分。

从官方介绍来看,这个架构有诸多的独特之处。

首先,它深度整合了腾讯内部丰富的业务资源,提前感受顶级大厂的技术创新氛围。

比如,它链接了包括量子、优图、玄武、QQ、腾讯混元、输入法、腾讯文档等多个实验室及业务部门,为青少年提供了真实且前沿的一线产业实践场景,以及腾讯特色的多元课题,让青少年深入参与到背后的研发过程当中。

其次,以标化的教务教研方法论、一体化的教务系统为基础能力,通过线下营地实训项目、线上赛事项目、以赛促学的实训项目、参与各业务实际课题等多种形式来培养。

以星火计划挑战营为例,它不再局限于理论知识的传授,而是让青少年直接参与到实际的科研和项目中,在实战中积累经验、提升能力。这样一来,为行业培养真正具有实践能力和创新精神的后备力量。

除了为拔尖高潜人才开创的星火挑战营,这个体系还包括科创青少年Mini鹅实训营、AI创想实训营等系列品牌,包含13套营地标准解决方案,这些方案覆盖了从基础互联网技能到人工智能、从数字创意到科技实践的全方位科技教育需求,已经服务了50万+青少年的科创学习,与学生、学校、教育主管部门、社会各界广泛链接。

可以看到的是,腾讯正在给广大青少年提供了接触先进科技、提升自身能力的机会,让更多孩子能够受益于科技教育,激发他们对科技的兴趣和创新潜力。

这一系列的培养体系,不仅让众多青少年在实践中步步找到自己的职业方向,更是在为整个社会、整个国家培养更多创新型人才。

只有当更多的企业像腾讯一样,积极投身于人才培养的事业中,才能为整个科技行业创造更大的价值。