新智元报道
编辑:好困 桃子
【新智元导读】冠军独享200万!一场让顶尖学术大佬、高校博士疯狂捞人组队的大赛,已向全球正式开赛。论文发表、大厂offer、算法落地,一键三连。
一场比赛,冠军独享约200万!
重赏之下,学术圈早已彻底坐不住了。
去年,曾单枪匹马杀入50多名的上科大博士,在线发帖邀约组队。
一大批学者在线捞队友,这究竟是什么比赛?
深扒一看,能让学术圈大佬为之疯狂的赛事,正是一年一届的腾讯广告算法大赛。
这几天,KDD Cup 2026的赛题正式公布,其中一道正是来自腾讯广告!
这一次,总奖金池高达88.5万美元,直接刷新了国内外同类企业技术竞赛的奖金纪录。
不仅如此,这次大赛还直接把论文发表路径、真实落地机会和职业通道绑在了一起,就问一句谁不想去啊!
一道来自中国的题
登上了全球最顶级的擂台
先说KDD是什么。
ACM SIGKDD,全称国际数据挖掘与知识发现大会,和ICML、NeurIPS并列,是机器学习和数据挖掘领域全球公认的三大顶会之一。
KDD Cup是其官方竞赛环节。能进KDD Cup的赛题,本身就代表着这个问题被学术界认可为「值得全球最聪明的一群人来攻克」。
2026年,腾讯广告算法大赛(TAAC)直接跳了一个台阶——
以KDD Cup 2026官方赛题的身份,把自己真实业务系统里啃不动的核心工程难题,摆到了全球研究者面前。
大赛官网:algo.qq.com
但这件事真正值得说道的地方,在于出题权。
过去很长一段时间,中国AI企业在国际学术舞台上的存在感,主要体现在「发论文」和「刷榜单」。
KDD Cup不一样。谁出题,谁就在定义这个领域的核心问题是什么,全球最顶尖的研究者就围绕这个问题展开工作。
历年KDD Cup的出题方,是Google、Amazon、Uber这样的全球科技巨头。腾讯广告这次拿到的,与其说是一个赛事合作的席位,不如说是一次「议题设置」的机会。
从「参与别人的议题」到「定义自己的议题」,这个转变,可能比赛事本身更值得关注。
跑了二十年的「双轨」架构
到了必须合并的时候
好了,那这道价值88.5万美元的题,到底在问什么?
赛题全称是「Towards Unifying Sequence Modeling and Feature Interaction for Large-scale Recommendation」,翻译过来就是:
在大规模推荐系统中,把序列建模和特征交互统一起来。
拆开来看,这道题直指推荐系统架构里一个绕不开的矛盾。
过去二十年,推荐系统的研究基本沿着两条线走。
第一条线是特征交互建模。
就是把用户的性别、年龄、设备类型、广告类别等各种静态特征拿过来,建模它们之间的交叉关系。DeepFM、DCN、Wukong这些经典模型,解决的都是这个问题。
第二条线是序列建模。
就是捕捉用户的行为轨迹。他先看了什么、后点了什么、买了什么、跳过了什么。DIN、DIEN、SIM、TWIN这些模型,关注的就是行为序列里的时序信号。
这两条线各自都取得了巨大的成功,但问题在于,它们基本是各自为政的。
在今天几乎所有大厂的推荐系统里,这两类信号是由两套完全不同的子网络分别处理的。
序列那边跑一个Transformer,特征那边跑一个交叉网络,最后在上层做一个浅层融合。这就是所谓的「双轨并行、后期融合」架构。
这套架构在CPU时代还能凑合用。但进入GPU时代之后,问题就大了。
两套异构子网络意味着算力的割裂。你很难用一块GPU同时高效地跑两种完全不同的计算图。
随着用户行为序列越来越长、模型规模越来越大,这种碎片化的架构正在成为系统规模化的核心瓶颈。更别提工程层面的复杂度了,两套网络意味着两套优化目标、两套调参逻辑、两套部署流程。
学术界和工业界已经有人意识到了这个问题。
近两年,Meta和字节跳动等大厂陆续推出了尝试打通这两条线的工作:
InterFormer(Meta AI/UIUC,CIKM 2025)探索了异构交互学习
OneTrans(ByteDance/NTU)尝试用单个Transformer统一特征交互和序列建模
HyFormer(ByteDance)则重新审视了两种建模范式各自的角色定位。
所以,腾讯今年在KDD Cup上抛出的这道题,实质上是向全球学术和工业界发起了一个挑战:
能不能设计一个单一同构的Recommendation Block,在一个架构里同时处理序列行为和多域特征交叉?
比赛框架概览
具体来说,每条训练/测试样本对应一个「三元组」(用户、上下文、目标广告/商品)。
输入包含两部分:一是用户属性、广告属性、上下文特征、交叉特征等非序列多域特征;二是用户的历史行为序列及其附带的异构侧信息。
从模型框架来看,序列特征和非序列特征分别通过专用的tokenizer转化为S token(序列token)和NS token(非序列token),再一起送入由统一block堆叠而成的同构骨干网络,最后接一个CVR预测头完成输出。
训练与评估中,模型采用「交叉熵损失函数」,最终排名以AUC of ROC为准。
比赛框架概览
参赛者需要构建模型,捕捉所有这些特征之间的关联,输出目标广告的预测转化率(pCVR)。
下面,重点来了。
赛题数据来自腾讯广告每日服务数十亿用户的真实业务系统,包含100个以上的脱敏特征字段,涵盖用户行为序列、用户属性、广告属性、上下文信号和交叉特征等多个维度。
数据以JSON格式提供,结构清晰。以用户行为序列为例,每条记录包含user_id和一个按时间排列的行为序列,每个行为事件包含item_id、action_type(曝光、点击、转化等)和timestamp。
非序列特征方面,用户特征包含性别、年龄、婚姻状态等字段,物品特征包含类型、品类、广告主类型等,上下文特征包含设备品牌、操作系统等稀疏特征,交叉特征则以稠密embedding向量的形式给出。
所有稀疏特征均已做匿名化处理,不包含任何原始文本、图片或个人可识别信息。
目前,官方已经在Hugging Face上开源了一份包含1000条样本的Demo数据集(TAAC2026/data_sample_1000),约68MB,采用Parquet格式,支持pandas和HuggingFace Datasets库直接加载,方便参赛者提前熟悉数据结构和字段定义。
传送门:https://huggingface.co/datasets/TAAC2026/data_sample_1000
值得注意的是,第二轮竞赛的数据量是第一轮的10倍。
参赛者需要在AUC指标上追求极致的同时,还必须满足严格的推理延迟限制——超时的提交直接作废,不论AUC多高。
效果和效率,两手都要硬。这就是工业界的真实约束。
更有意思的是,赛事还专门设置了两个独立于排名之外的创新奖:
统一架构创新奖(4.5万美元)
Scaling Law创新奖(4.5万美元)
腾讯希望鼓励(但不强制)参赛者去探索:如何针对序列和非序列特征(或Token),构建可堆叠的统一建模架构; 推荐模型的Scaling Law。
前者奖励在统一建模架构上有原创突破的团队,后者奖励在推荐系统Scaling Law探索上有深刻洞察的团队。
换句话说,即使你的AUC不是最高的,只要方法有足够的新意和学术价值,同样有机会拿到重量级奖项。
还有一条规则值得注意:赛事全程禁止模型集成/融合。
这个限制很有针对性。它逼着参赛者在单一架构上做到极致,而不是靠堆模型数量来刷分。
因为腾讯要的不只是一个跑分最高的模型,它想看到推荐系统架构层面的根本性创新。
高校与业界,首次同解一道题
2026年赛事的另一个重大变化,是首次开设了面向在职人士的工业赛道。
这个决定背后的逻辑值得细说。
过去几年,腾讯广告算法大赛一直是高校学生的主场。
学生有创造力、有时间、敢想敢试,但他们缺少对真实系统约束的体感。在实验室里,你可以把模型搞得很复杂,因为没有延迟预算;你可以用很大的batch size,因为不用考虑线上serving的内存开销。但工业界不是这样的。
反过来,在大厂做推荐系统的工程师们,每天都在和延迟、吞吐量、资源分配搏斗,他们对系统约束的理解是刻在骨子里的。但长期在业务中打补丁式的优化,也容易让人陷入局部最优,很难跳出来做架构层面的根本性反思。
今年的赛题恰好处在这两种能力的交叉点上。
「统一建模」既是一个需要架构创新思维的学术问题,也是一个必须尊重工程约束的系统问题。光有想法不够,光有经验也不够。
所以,2026年赛事分成了两条赛道:
学术赛道面向全球高校全日制在读学生(本科、硕士、博士、博士后),总奖金54万美元。冠军独享30万美元(约200万人民币),亚军9万美元,季军4.5万美元,第4到10名各1.5万美元。参赛者需提供学术身份证明。
工业赛道面向所有社会人士,包括个人、研究机构、企业团队,总奖金25.5万美元。冠军15万美元,亚军7.5万美元,季军3万美元,第4到10名每队获得一台Apple iPad Air。
两条赛道做同一道题,分开排名。但最终呈现在KDD舞台上的,将是两个群体对同一个问题给出的不同解法。学生可能会提出结构上更大胆的统一方案,工程师可能会在效率和可落地性上打磨得更精细。
这种碰撞本身,就是产学研融合最理想的形态。
从腾讯广告的角度看,这也是一步人才生态的棋。
学术赛道吸引的是未来三到五年的核心算法人才储备,工业赛道触达的是当下就能产生业务价值的资深工程师群体。两条线并行,构建的是从校园到职场、从论文到系统的完整人才链路。
对于参赛者来说,两条赛道各有各的实在价值。
工业赛道这边。
对于工程师来说,这不只是一场竞技,也是一张通往腾讯业务前线的「入场券」。
优秀选手有机会加入腾讯,亲自把自己的想法放到真实广告系统中去验证和迭代。也就是说,你的代码不是跑完比赛就扔掉,它可能真的会影响每天数十亿次的广告决策。
通过腾讯Angel机器学习平台,参赛者可直接使用免费高性能GPU算力,对于很多中小公司的参赛团队来说,这是一次难得的大规模实验机会。
学术赛道这边。
对于学生来说,KDD Cup的参赛经历可以直接写入学术CV,这个背书在全球ML/AI圈的含金量不用多说。
优秀成果会被邀请在KDD Workshop分享,并收录在KDD 2026 Workshop Proceedings,进入决赛的队伍全员还有机会可获得腾讯实习Offer并有机会转正。
换个角度来看,这场赛事提供的其实是一个三维价值闭环:
学术维度,KDD Cup的背书、Workshop paper的发表路径、顶尖评审团的认可;
商业维度,冠军方案经过离线A/B验证后有机会直接落地到腾讯广告的生产系统;
职业维度,参赛者可获得腾讯人才绿色通道,优秀选手直通校招或社招面试。
三条线在同一场赛事里拧在一起,这在算法竞赛里并不多见。
(需要注意的是,腾讯员工不可参加任何赛道。)
推荐系统的下一个范式
可能就藏在这道题里
如果把腾讯广告算法大赛近两年的赛题放在一起看,能读出一条清晰的技术演进脉络。
2025年的赛题是「全模态序列生成式推荐」(AMGR),探索的是推荐系统从判别式到生成式的范式转换。能不能用生成模型来「创造」推荐内容,而不是只在候选库里「挑选」。
2026年的赛题转向了「统一建模」,追问的是一个更底层的架构问题。在生成式推荐的浪潮到来之前,推荐系统的基座架构本身是不是需要先完成一次根本性的重构?
从「上层范式创新」到「底层架构统一」,这个演进方向耐人寻味。
腾讯广告的技术团队正在系统性地沿着推荐系统的技术栈向下挖掘。先探索了上层的生成式可能性,现在要回过头来把地基打牢。
而统一建模这个地基一旦打下去,紧接着就能释放另一个巨大的可能性——推荐系统的Scaling Law。
我们已经在大语言模型上见证了Scaling Law的威力。但推荐系统的Scaling Law是什么?这个问题几乎没有人系统性地回答过。
原因在于,传统的推荐系统架构是碎片化的。序列模块和特征交叉模块各自独立,根本没有一个统一的骨干网络可以「scale」。
拿DeepFM来说,你把层数从10层叠到100层,效果不会线性提升,因为它的架构天花板很低。再看DIN,你把序列长度从100扩展到10000,延迟直接爆炸,因为它的注意力机制压根不是为这种规模设计的。
这恰恰是「统一建模」和「Scaling Law」两个命题深度绑定的原因。
只有当你有了一个统一的、同构的、可堆叠的骨干网络,Scaling Law的探索才有了载体。你才能系统性地回答:
推荐模型的效果,到底如何随参数量、数据量、计算量的变化而变化?这条曲线是什么形状?拐点在哪?
如果这个问题被回答了,推荐系统的优化就能从「经验驱动的手动调参」走向「规律驱动的可预测扩展」。
广告平台将能够更精确地评估,再投入多少算力,能换来多少转化率的提升?对于支撑着千亿美元数字广告市场的推荐系统来说,这几乎是圣杯级别的问题。
腾讯专门为Scaling Law探索设了一个4.5万美元的创新奖,而且明确说了,这个奖独立于排名之外,评审看的不是AUC分数,而是方法论的新颖性和洞察的深度。
这个设计本身就说明,腾讯对这个方向的战略押注是认真的。
3月19日,正式开赛
一道来自中国互联网广告前线的工程难题,现在摆在了全球最顶尖算法研究者面前。
88.5万美元的奖金池已经就位,KDD 2026的颁奖舞台正在搭建。
3月19日,大赛正式开赛。 整个赛程从3月跨越到8月(以下均为AOE时间)。
3月15日:Demo数据集发布
3月19日 - 4月23日:全球报名期
4月24日 - 5月23日:第一轮竞赛
5月25日 - 6月24日:第二轮竞赛
8月9日:KDD 2026会议现场颁奖
赛事在公平性上也下了功夫。
第一轮采用严格的反过拟合控制,包括提交次数限制和延迟反馈机制,必要时还会启动滚动准入机制(最多支持5000支队伍并发)。
第二轮所有提交必须在官方环境中通过可复现性验证和规则合规检查,确保最终排名经得起检验。
每队1-3人,每人只能加入一支队伍。4月23日之后不允许任何队伍变更。排名以AUC of ROC为唯一指标,但必须满足对应赛道和轮次的推理延迟限制。
不管你是在校园里追论文的学生,还是在大厂里调系统的工程师,这道题都值得你认真看一眼。
大赛官网:algo.qq.com
赛事联系邮箱:taac@tencent.com
热门跟贴