界面新闻记者 | 张蕊
界面新闻编辑 | 任雪松

一个德国人,连续猜对了最近三届世界杯冠军。他不是足球评论员,也不是博彩精算师,甚至不太看球员数据。他的模型里装的不是球星名字,而是人均GDP、人口规模、足球在一个国家社会中的位置。今年,他的预测指向荷兰。

这位德国经济学家叫约阿希姆·克莱门特(Joachim Klement)。2014年他的模型选中德国,2018年选中法国,2022年选中阿根廷,三届全部命中,无一失手。对于即将开赛的美加墨世界杯克莱门特的结论是:荷兰将在决赛中击败葡萄牙,捧起大力神杯。

一个用经济和社会数据的人,凭什么预测足球比赛?

克莱门特供职于英国券商Panmure Liberum,他构建的预测模型包含五个变量:人均GDP、人口规模、气候、东道主身份,以及一个随机性因子。

人均GDP的逻辑在于,一个国家只有足够富裕,才能建得起像样的球场、培养得出好教练、支撑起完善的青训体系,这是足球人才出产的底层硬件;人口规模决定了人才基数的上限;气候影响的则是足球训练和比赛的物理条件,克莱门特评估认为最适合的温度约在14°C;东道主身份,则是因为主场球迷的支持能给球队带来微弱优势,而这可能就是胜、平、负之间的区别;随机性因子,是模型对人自身不可预测性的认账:比赛终归是人踢的,不是机器算的。

 克莱门特预测的淘汰赛树状图
打开网易新闻 查看精彩图片
克莱门特预测的淘汰赛树状图

这套逻辑在克莱门特过去三届预测中得到了验证。但试图用模型“破解”世界杯的,远不止他一人。

华尔街投行高盛也有自己的传统:从2010年起,这家投行每逢世界杯都会发布预测报告,今年也不例外。世界杯开幕前两周,高盛首席经济学家简·哈齐乌斯(Jan Hatzius)带着团队发布了2026年世界杯预测报告。

高盛的模型选了与克莱门特完全不同的路径:它不关心GDP,核心是Elo等级分体系。Elo原本是用来衡量国际象棋选手实力的评分系统,后来被移植到足球领域,根据每场比赛的结果和对手强弱,动态调整球队分值。

截至高盛发布报告时,西班牙在Elo榜单上位居全球第一,比第二名阿根廷高出52分,比法国高出84分,几乎是断层式领先。高盛在此基础上叠加上进攻天赋、球队状态、地理因素和抽签路径四个边际变量,对着48支球队、104场比赛做了5万次模拟。结果:西班牙以26%的夺冠概率成为最大热门,法国19%、阿根廷14%、巴西8%、英格兰和荷兰各约5%。

两套经济学模型,给出了两个不同的冠军。这不是谁对谁错的问题,而是一场“用哪把尺子量世界”的选择。克莱门特的问题是关于经济基础的,即一个国家有没有长出好球员的条件?高盛的问题则是关于竞技实力的,即一支球队当下到底有多强?同一项赛事,从不同的角度建模,得到了不同的答案。

 图源:FIFA世界杯官方微博
打开网易新闻 查看精彩图片
图源:FIFA世界杯官方微博

经济模型之外,还有其他人在用自己的方式押注答案。

美国统计学家、《信号与噪声》的作者纳特·西尔弗(Nate Silver),带着名为PELE的新模型登场了。他在传统Elo评分里嵌入球员市场价值,并引入了一个"Tilt"因子,即近几届冠军往往在前一届表现的基础上获得额外模型增益。PELE跑完10万次模拟后,给西班牙的夺冠概率约22%,法国18%,阿根廷12%,每日更新。三个热门与高盛的排序一致,但西尔弗对卫冕冠军阿根廷的态度比高盛更为积极。

科技媒体的做法更直接——Decrypt把同样的任务交给了七个AI模型,让它们各自预测世界杯冠军。结果是四个选了西班牙、三个选了阿根廷。

而比结果更有意思的,是分歧的源头。顺藤摸瓜查下去发现,分歧根本不在于足球分析水平的高低,而在于每个模型抓取的是哪个Elo评级源:选用实时足球Elo评分(西班牙排第一)的Opus、GPT、Stepfun、Nemotron,无一例外地把票投给了西班牙;而参考FIFA排名或俱乐部加权评分(阿根廷、法国、巴西均排在西班牙之前)的DeepSeek、MiniMax、Qwen,则更倾向于阿根廷。

 7个AI模型的预测结果
打开网易新闻 查看精彩图片
7个AI模型的预测结果

中国AI公司也加入了这场竞赛。Kimi(月之暗面)调动了300个AI智能体,从战术、球员、赛程、历史等维度预测每一场比赛,甚至还专门设置了一个“反方组”,由一批与主流预测持相反意见的智能体专职寻找翻车风险。

Kimi的首期预测指向了一个出人意料的方向——德国可能“爆冷”夺冠。理由是:德国连续两届小组出局的“近因偏差”持续压低了市场定价,而穆西亚拉和维尔茨组成的新前场已经解决了此前的攻坚难题。38岁的主帅纳格尔斯曼恰好是将AI深度融入训练的代表人物,这一因素也被纳入了模型。

Kimi在官宣文章里开门见山:“我们的预测很可能是错的。”但他们把整个分析过程、预测结果和赛后复盘放在了同一套透明框架中,任凭外界检验。

此外,还有一条预测线索来自虚拟世界。6月初,美国艺电(Electronic Arts)旗下体育游戏品牌EA Sports基于FC 26游戏引擎完成了最新一届世界杯模拟。结果也将冠军指向了西班牙队。值得一提的是,EA Sports的模拟历史相当漂亮:2010年选西班牙、2014年选德国、2018年选法国、2022年选阿根廷,近四届全部命中。

至于真金白银的预测市场,则是另一套读数。截至6月9日,Polymarket平台上西班牙夺冠概率约16%,法国约16%,阿根廷约10%,前十之外的其余球队合计约占两成。与高盛26%的评估相比,市场对西班牙的信心明显更低——但市场定价是动态的,开赛后的每一场比赛都可能改变这些数字。预测市场的逻辑和经济学模型截然不同:后者的优势是“有道理”,前者的优势是“押注者真的会输钱”,因此会把各种隐性的场外信息也纳入定价。

 Polymarket平台数据
打开网易新闻 查看精彩图片
Polymarket平台数据

这些模型预测得到底准不准?历史成绩称不上漂亮。

2022年卡塔尔世界杯前,高盛的模型把巴西排在第一(24%),阿根廷第二(21%),法国第三(19%)。最终阿根廷夺冠,巴西止步八强。高盛确实把冠军锁定在了前三名,但排序是错的——球迷如果按概率投注,恐怕输多赢少。

克莱门特连续三届命中,从纯概率角度看,即便每次猜对的概率只有25%,三连中的几率也不过1.6%左右——主要靠运气的可能性已经很小。但连续三届的样本终究有限,他的模型的“真本事”还需要接下来的比赛进一步验证。

模型自己也清楚这些局限。高盛在报告中列出了四类模型盲区:无法有效衡量非进攻端才能(如中场厚度和守门员点球价值),不考虑球员伤病状态和个人赛季状态变化,也难以捕捉主教练因素的潜在影响。报告结尾处的类比颇为直白:足球的内在不可预测性,使得统计显著性始终有限,这与押注高波动资产时的处境如出一辙。

Stepfun 3.7模型在二次修正之前,也跑出了一个荒诞的结果:排名前三的热门球队是墨西哥、南非和韩国。它的开发者没有遮掩这次翻车,而是公开解释了整个过程:用人工生成的预期进球数来拟合国家队数据,反而抹平了强队与弱队之间的真实差距,发现问题后干脆全盘推倒,改用纯Elo评分重建。

所有这些模型,本质上都在探索同一个问题:世界杯的结果,到底能不能被算出来?克莱门特说经济基础决定上层建筑,高盛说竞技实力见真章,Kimi说别忘了人是会犯错的。答案不唯一,就像即将在明日凌晨开幕的世界杯本身——48支球队、104场比赛,很快会给出它自己版本的答案。