想知道谁能拿下2026世界杯,过去得靠水晶球、茶叶占卜,或者期待章鱼保罗显灵。现在,数据科学给了我们一种更靠谱的选择。一组统计学家训练了一个机器学习算法,让它去推演整届赛事最可能的走向。

这套算法分两步走。第一步,把精密的统计模型、博彩公司和转会市场的专业判断融在一起,摸清所有球队和球员的实力底子。第二步,由机器学习算法决定如何把这些实力评估和其他球队信息做最优结合。最终,它为每场可能发生的对决都生成了一个概率预测——就像一对灌了铅的骰子,不再是1到6点各六分之一的机会,而是每支队进球数有着不同的概率。比方说,在它的预测里,墨西哥在揭幕战的平均进球数是1.9个,对手南非只有0.7个。但这不是说墨西哥稳赢,而是墨西哥取胜的概率最高,达到65%,平局概率是21%,南非赢球的概率最低,只有14%。

打开网易新闻 查看精彩图片

研究者用不同配对的“铅骰子”,把世界杯每一场结果都模拟出来,同时严格参照官方抽签分组和所有国际足联规则,连加时赛和点球大战都纳进去了。在跑了十万次模拟之后,冠军轮廓才浮现。西班牙以14.5%的夺冠概率成为最大热门,英格兰和法国紧追其后,各是12.4%,德国以11.2%排在第四。因为本届世界杯扩军到48支球队,淘汰赛足足要打五轮,这导致热门集团挤得很紧。葡萄牙有8.9%的夺冠机会,阿根廷是8.2%。美国队闯入三十二强的概率高达78%,在所在小组里最高。但进入一场定生死的淘汰赛阶段后,他们“存活”的概率就迅速下滑。在7月19日新泽西大都会人寿体育场的决赛里,东道主捧杯的概率是1%。

这套机器学习和后续模拟的燃料,是数据、专家知识和统计模型。算法把球队和球员的每一项实力参数,都量化成进球预期,再经由十万次推演,把运气和冷门也变成可计算的概率。最后你会发现,热门和冷门之间的距离,往往比想象中窄得多。