大家好,我是小川。
很多人都有过猜世界杯冠军的经历,赌球网站的赔率、球队的名气、球星的状态,总能成为投注的理由。
2023 年英国一名男子花 5 英镑猜中 30 场赛事狂揽 48.6 万英镑,2015 年莱斯特城以 1 赔 5000 爆冷夺冠也有人押中,这让不少人想找科学的世界杯预测方法。我最近就用泊松分布、蒙特卡洛算法搭了模型,结果还真有点颠覆认知。
要预测世界杯冠军,核心要先搞定单场比赛的胜负。毕竟 48 支球队的淘汰赛,最终都要看每场对决的结果。而单场胜负的本质,是比分的博弈。
比如阿根廷的预期进球数设为 2.49,那么进 1 球的概率约为 20.64%,进 2 球的概率约为 25.7%,进 3 球的概率约为 21.33%。如果对手美国的预期进球数是 0.873,同样算出其进球概率,将两队的概率相乘,就能得到不同比分的获胜概率。
关键问题来了,预期进球数怎么算?我用了迪科斯科模型,将其拆解为进攻预期、防守预期和其他修正系数三个部分。
先抓取 2015 年以来所有国家队的国际比赛比分作为基础数据,赛事参考价值每两年衰减一半,越近的比赛权重越高。再通过最大释然估计的迭代计算,也就是不断调整参数贴合历史结果,最终算出每支球队的进攻和防守数值。
最后还要加上修正系数,比如巴西队有多名主力伤病,就下调其进攻系数 0.9;西班牙队预选赛因亚马尔缺席较多,但正赛他可回归,就上调系数 1.1。
有意思的是,国足的相关数据也被算出来了,在模型里排在第 104 名,和世界排名基本吻合,也验证了这个模型的靠谱程度。
美加墨世界杯共有 48 支球队,分为 12 个小组,每组 4 支球队打单循环,每个小组有 6 场比赛。理论上,每个小组的排名结果有 24 种可能,12 个小组的组合就是 24 的 12 次方,换算下来约有 3.6 亿亿种可能,根本没法一一计算。
这时候就得用到蒙特卡洛算法了。听起来名字唬人,其实就是根据之前算出的概率,把世界杯在平行世界里模拟几千上万次。我总共模拟了 2 万次,最终统计出各队夺冠的概率。
最终结果显示,阿根廷夺冠概率最高,其次是西班牙、巴西、英格兰,法国仅排第五。这个结果和博彩公司的赔率参考相去甚远,庄家给出的前两位是西班牙和法国。
有意思的是,博彩公司的模型其实更精细,比如用 xg boost 模型分析每一次射门的距离、防守人员情况、射门方式,收集海量数据来优化预测。但现实情况是,他们的预测也经常翻车。
回看最近三届世界杯,博彩公司的热门预测几乎从未应验:2014 年巴西世界杯,庄家第一热门是巴西,结果半决赛被德国 7-1 血洗,最终夺冠的是德国;2018 年俄罗斯世界杯,巴西和德国并列第一,结果夺冠的是没进前三的法国;2022 年卡塔尔世界杯,巴西仍是第一热门,最终夺冠的是阿根廷。
这背后藏着足球运动的本质:充满随机性。世界杯单场淘汰赛定胜负的赛制,更是放大了这种变数。一场比赛的一个单刀、一次误判,都能改变最终结果,这也是世界杯迷人的原因之一。
这意味着,普通人只要避开非理性投注的误区,用理性的方式分析,理论上可能赚到差价。但请务必注意,世界杯的偶然性太强,所有预测都仅供娱乐,切勿当真。
热门跟贴