佛得角黑马都猜到，62%准确率胜人类，AI比球迷更懂世界杯？|世界杯小组赛|佛得角|西班牙|阿根廷|马林|黑马

图片来源：新华社

出品｜搜狐科技

作者｜张莹常博硕

“这还用AI？”

7月4日，阿根廷对阵佛得角。有彩民正准备拿出4000块，买阿根廷3:0佛得角。当我们试探性的问是否用“AI预测”，他像听到一个笑话。

那是我们7月2日在彩票店门口遇到的一个人。

对于部分资深球迷，他们似乎更相信自己的判断。但如果把人类视为整体，AI胜率已经显著超过普通人类玩家：AI的准确率为61.9%，人类预测准确率为56.5%。

这是一场备受关注的比赛。佛得角上一次对阵西班牙时踢出了0:0，被媒体称为“本届世界杯开赛以来最大冷门”。世界排名第67位、人口仅50余万的西非岛国，用顽强的防守逼平了夺冠大热门。

没人能想过他们能闯进32强，但是有四款AI想到了。

对于7月4日的这场比赛，截至发稿，天禧AI显示共有9.9万人参与竞猜，100%的AI预测阿根廷胜；83.3%的人类预测阿根廷胜，还有9.3%预测平局，7.4%预测佛得角胜。

正值四年一次的世界杯，谁能拿到冠军、每场比赛哪支队伍胜利、比分如何，这些预测大讨论过去只存在于人类之间，这一次，AI厂商们也把世界杯预测作为宣传重点。

问题是，AI到底是怎么预测世界杯的？它真的比资深球迷更懂球吗？如果AI真的只是概率游戏，那又为什么会猜中佛得角进32强？

人类直觉和AI算法

世界杯期间，彩票店的生意也更好了。

老板说，世界杯期间店里“凑热闹的多”，但真正撑起生意的还是老彩民。“老顾客一个人买的，顶新顾客十个人。”有人一下看好了就打得多，好几个人一块儿打，一人一份，加起来能上万。前几天有人中了五万多。

但这些人，有多少人参考了AI的意见不得而知。

有彩民表示，她们全家人都买了世界杯彩票，没有人用AI。“我就支持谁买谁。”她甚至不太关心对手是谁。对她来说，买彩票不是下注，是表达支持。AI算的是概率，她在乎的是立场。

在彩票店门口，我们还遇到一个花了4000块钱押注阿根廷3:0佛得角的彩民。当我们试探着问了一句“您用AI预测吗”，他语气带着不解：“这还用AI？”然后转身走了。

对于不懂球的老板，她也试过用AI，但“试了好几个AI，一个都没中。”有了这些失败的经历，当我们问及AI有用吗，老板脱口而出“不准”。

但紧接着她又说了一句，“不过你下载个体彩APP看看赔率，再和你的AI做个比较。信息越多越好。”

她还讲了一个故事，有个女孩，从来没买过彩票，听大家聊完球，自己综合了一下，花几十块中了七百多。“她也没用AI，”老板娘说，“就是听大家说，自己看赔率，综合了一下。”在彩票店里，“信息拼盘”才是主流的决策方式。

但这些来自彩票店一线“AI不准”的感受，和实际数据有些出入。

联想和咪咕视频还一起做了一个AI模型预测胜率排名。这场“人机大战”的结果和预想不同。截至发稿，AI的准确率为61.9%，而人类预测准确率仅56.5%，AI胜率已经显著超过普通人类玩家。

在32强预测榜单中，腾讯混元以32场猜中29场暂时领跑，成为当前预测准确率最高的大模型。MiniMax、讯飞星火均为 28/32，DeepSeek、智谱同为 27/32。

整体来看，目前国内12家AI对传统强队和主流晋级队判断高度一致，真正拉开差距的是波黑、佛得角、刚果（金）、加纳等边缘晋级队，以及伊朗、韩国、乌拉圭等出局判断。

甚至腾讯混元、阶跃星辰、讯飞星火、商汤小浣熊这4家，提前一个月就将佛得角写进了32强名单。

而人类阵营则一致把票投给了西班牙和乌拉圭：一个是欧洲杯冠军，一个是两届世界杯冠军。佛得角作为首次站上世界杯舞台的大西洋岛国，没人能想到他们能挺进32强。

此后，四个AI的判断被证实是对的。我们好奇的是，AI是如何做到的？

AI如何“看懂”世界杯？

很多人对AI预测体育的理解仍停留在，输入历史数据，模型给出结果。但事实是，目前的AI预测并不是这样。

联想集团天禧 AI 事业部总经理陈学桂对搜狐科技表示，体育比赛尤其是世界杯，信息变量太多，而且高度动态变化。一场比赛的胜负，可能同时受到球队整体实力、近期战绩、球员伤病情况、战术风格、小组赛出线压力、轮换意愿、临场状态甚至天气、场地等外部因素，这些信息分散在不同数据源中，更新频率也完全不同。因此，大模型需要的不只是思考能力，还需要获取信息的能力。

“你要去获取这些实时数据，里面肯定都要用到搜索。比如你要查不同的域、不同的数据源，怎么去整理时效性，让这个信息更可信，这些工作放到智能体完成，效果会更好。”

商汤科技技术总监马林则给了搜狐科技更具体的技术路径。以商汤小浣熊为例，系统会先对两支球队建立一个基础能力评估，包括：历史战绩、球队排名、阵容身价、攻防效率以及过去交手记录。这相当于建立一个初始胜率模型。

第二层是实时动态修正，这部分决定了预测是否足够准确。例如球员是否伤病、核心球员是否停赛、球队是否已经提前晋级、下一场是否可能轮换阵容。这些实时信息会持续改变模型判断。

“我们首先会看两队的整体实力，会进行一个基础打分。还会获取实时的球员以及球队状态，是否有伤病，然后会对比分进行调整。”

马林举了一个例子：“如果我们已经有了百分百晋级的球队，那它下一场比赛的战意以及轮换程度，肯定跟另一个球队不一样。”

第三层，则是对位分析。“比如面对法国队的时候，姆巴佩对位的后卫是谁？年龄怎么样，这些我们也都会考虑进去。”这些局部博弈因素，往往决定关键比赛走势。也就是说，AI看的不只是宏观数据，甚至也能开始分析比赛中的微观对抗关系。

对于同一场比赛，大模型给出的结果也可能不同。

有业内人士对搜狐科技解释：“首先数据其实也有差别，公开信息可能只有一些新闻报道。但有些专业的数据库里包括球员跑动距离、xG（预期进球）等等，这就造成了差异。还有就是不同模型Agent架构差异很大，即便数据和Agent流程一样，不同大模型的推理能力也不同。”这些差异最终体现在预测结果上。