图片来源:新华社
出品|搜狐科技
作者|张莹 常博硕
“这还用AI?”
7月4日,阿根廷对阵佛得角。有彩民正准备拿出4000块,买阿根廷3:0佛得角。当我们试探性的问是否用“AI预测”,他像听到一个笑话。
那是我们7月2日在彩票店门口遇到的一个人。
对于部分资深球迷,他们似乎更相信自己的判断。但如果把人类视为整体,AI胜率已经显著超过普通人类玩家:AI的准确率为61.9%,人类预测准确率为56.5%。
这是一场备受关注的比赛。佛得角上一次对阵西班牙时踢出了0:0,被媒体称为“本届世界杯开赛以来最大冷门”。世界排名第67位、人口仅50余万的西非岛国,用顽强的防守逼平了夺冠大热门。
没人能想过他们能闯进32强,但是有四款AI想到了。
对于7月4日的这场比赛,截至发稿,天禧AI显示共有9.9万人参与竞猜,100%的AI预测阿根廷胜;83.3%的人类预测阿根廷胜,还有9.3%预测平局,7.4%预测佛得角胜。
正值四年一次的世界杯,谁能拿到冠军、每场比赛哪支队伍胜利、比分如何,这些预测大讨论过去只存在于人类之间,这一次,AI厂商们也把世界杯预测作为宣传重点。
问题是,AI到底是怎么预测世界杯的?它真的比资深球迷更懂球吗?如果AI真的只是概率游戏,那又为什么会猜中佛得角进32强?
人类直觉和AI算法
世界杯期间,彩票店的生意也更好了。
老板说,世界杯期间店里“凑热闹的多”,但真正撑起生意的还是老彩民。“老顾客一个人买的,顶新顾客十个人。”有人一下看好了就打得多,好几个人一块儿打,一人一份,加起来能上万。前几天有人中了五万多。
但这些人,有多少人参考了AI的意见不得而知。
有彩民表示,她们全家人都买了世界杯彩票,没有人用AI。“我就支持谁买谁。”她甚至不太关心对手是谁。对她来说,买彩票不是下注,是表达支持。AI算的是概率,她在乎的是立场。
在彩票店门口,我们还遇到一个花了4000块钱押注阿根廷3:0佛得角的彩民。当我们试探着问了一句“您用AI预测吗”,他语气带着不解:“这还用AI?”然后转身走了。
对于不懂球的老板,她也试过用AI,但“试了好几个AI,一个都没中。”有了这些失败的经历,当我们问及AI有用吗,老板脱口而出“不准”。
但紧接着她又说了一句,“不过你下载个体彩APP看看赔率,再和你的AI做个比较。信息越多越好。”
她还讲了一个故事,有个女孩,从来没买过彩票,听大家聊完球,自己综合了一下,花几十块中了七百多。“她也没用AI,”老板娘说,“就是听大家说,自己看赔率,综合了一下。”在彩票店里,“信息拼盘”才是主流的决策方式。
但这些来自彩票店一线“AI不准”的感受,和实际数据有些出入。
联想和咪咕视频还一起做了一个AI模型预测胜率排名。这场“人机大战”的结果和预想不同。截至发稿,AI的准确率为61.9%,而人类预测准确率仅56.5%,AI胜率已经显著超过普通人类玩家。
在32强预测榜单中,腾讯混元以32场猜中29场暂时领跑,成为当前预测准确率最高的大模型。MiniMax、讯飞星火均为 28/32,DeepSeek、智谱同为 27/32。
整体来看,目前国内12家AI对传统强队和主流晋级队判断高度一致,真正拉开差距的是波黑、佛得角、刚果(金)、加纳等边缘晋级队,以及伊朗、韩国、乌拉圭等出局判断。
甚至腾讯混元、阶跃星辰、讯飞星火、商汤小浣熊这4家,提前一个月就将佛得角写进了32强名单。
而人类阵营则一致把票投给了西班牙和乌拉圭:一个是欧洲杯冠军,一个是两届世界杯冠军。佛得角作为首次站上世界杯舞台的大西洋岛国,没人能想到他们能挺进32强。
此后,四个AI的判断被证实是对的。我们好奇的是,AI是如何做到的?
AI如何“看懂”世界杯?
很多人对AI预测体育的理解仍停留在,输入历史数据,模型给出结果。但事实是,目前的AI预测并不是这样。
联想集团天禧 AI 事业部总经理陈学桂对搜狐科技表示,体育比赛尤其是世界杯,信息变量太多,而且高度动态变化。一场比赛的胜负,可能同时受到球队整体实力、近期战绩、球员伤病情况、战术风格、小组赛出线压力、轮换意愿、临场状态甚至天气、场地等外部因素,这些信息分散在不同数据源中,更新频率也完全不同。因此,大模型需要的不只是思考能力,还需要获取信息的能力。
“你要去获取这些实时数据,里面肯定都要用到搜索。比如你要查不同的域、不同的数据源,怎么去整理时效性,让这个信息更可信,这些工作放到智能体完成,效果会更好。”
商汤科技技术总监马林则给了搜狐科技更具体的技术路径。以商汤小浣熊为例,系统会先对两支球队建立一个基础能力评估,包括:历史战绩、球队排名、阵容身价、攻防效率以及过去交手记录。这相当于建立一个初始胜率模型。
第二层是实时动态修正,这部分决定了预测是否足够准确。例如球员是否伤病、核心球员是否停赛、球队是否已经提前晋级、下一场是否可能轮换阵容。这些实时信息会持续改变模型判断。
“我们首先会看两队的整体实力,会进行一个基础打分。还会获取实时的球员以及球队状态,是否有伤病,然后会对比分进行调整。”
马林举了一个例子:“如果我们已经有了百分百晋级的球队,那它下一场比赛的战意以及轮换程度,肯定跟另一个球队不一样。”
第三层,则是对位分析。“比如面对法国队的时候,姆巴佩对位的后卫是谁?年龄怎么样,这些我们也都会考虑进去。”这些局部博弈因素,往往决定关键比赛走势。也就是说,AI看的不只是宏观数据,甚至也能开始分析比赛中的微观对抗关系。
对于同一场比赛,大模型给出的结果也可能不同。
有业内人士对搜狐科技解释:“首先数据其实也有差别,公开信息可能只有一些新闻报道。但有些专业的数据库里包括球员跑动距离、xG(预期进球)等等,这就造成了差异。还有就是不同模型Agent架构差异很大,即便数据和Agent流程一样,不同大模型的推理能力也不同。”这些差异最终体现在预测结果上。
AI算得准什么,算不准什么?
但AI也有它的边界。
“我们大模型很难预测爆冷。”马林说得非常直接。
他继续解释道:“因为它本质上是一个概率模型。它天然倾向于输出高概率结果。所以,当强队胜率是80%,弱队爆冷概率只有20%时,大模型通常仍然会选择强队。因为这是统计意义上的最优解。”
有业内人士对搜狐科技表示:“如果模型总是输出低概率事件,结果反而会整体变差。”
该业内人士算了一笔账,“假设一场比赛,强队胜的真实概率是80%,平局是15%,弱队爆冷胜是5%。如果你每次都预测强队胜,那么这类比赛的预测准确率就是80%。如果你为了捕捉冷门,每次都预测“弱队爆冷胜”你的准确率会瞬间跌到5%。”
他补充道,即便只是在部分场次选择冷门,但只要故意选择低概率成为一种策略,绝大多数时候都在对抗大概率事实,结果很可能是错误次数大幅上升,整体准确率也会下降。
他还表示:“从数据角度看,爆冷之所以难预测,不单是因为概率低,还因为爆冷的原因往往极度个性化且稀疏,比如可能是裁判的某个判罚或者核心球员突然受伤、情绪波动等等,这些信号在历史数据中很少出现,模型也很难学到稳定规律。”
西班牙被佛得角0比0逼平,就是最典型的例子。
赛前,12款主流AI模型大多预测西班牙轻松取胜,比分集中在3比0和4比0。电竞解说王多多也预测西班牙4比0获胜。结果出人意料,0比0,成为本届世界杯第一场没有进球的比赛。
世界杯的特殊性也让预测难度大幅提升。马林表示,“联赛一般是比分制的,每场都要争胜。但世界杯是杯赛,要考虑长久性,可能一个杯赛有7场、8场比赛,不能把全部的精力投入到每一场小组赛。”
对于一些资深球迷,他们不靠AI,他们下注时的判断,可能来自经验、可能来自直觉、可能只是来自“我看了二十年球,这事不需要工具来判断”的自信。
陈学桂在采访表示,“AI特别擅长去访问、控制、组织浩瀚的知识,这是AI的优势。它可以快速调用几十年历史数据,处理远超人类的信息量。”
但他也强调,人类仍有不可替代的能力。“人类更擅长做第一性原理的分析,去找价值、做判断。这也是AI目前难以真正替代人的地方。”
运营编辑 | 曹倩 审核|孟莎莎
热门跟贴