2026年世界杯小组赛刚打完,32强名单尘埃落定。韩国走了,伊朗也走了,传统强队基本没出什么意外。
但今年赛场外有一场更安静的较量,结果也刚公布。
12个国内AI大模型——从腾讯混元到DeepSeek,从讯飞星火到MiniMax——搞了一场世界杯预测人机大战。最终成绩单:腾讯混元29/32高居榜首,MiniMax和讯飞星火各28/32并列第二,DeepSeek、智谱、联想天禧AI各27/32紧随其后。
单看数字,AI确实有点东西。29/32的正确率,人类专家也未必能稳定做到。
但真正有意思的不是谁排第一,而是那几场"集体分歧"的预测,恰好撕开了AI能力的真实边界。
AI在确定性面前很强,但不确定性才是试金石
12家模型对巴西、德国、法国这些传统强队的晋级预测几乎完全一致。这不奇怪——历史数据充足、球队实力清晰、舆论风向明确,这类确定性高的问题正是AI的舒适区。
真正的分歧出现在波黑、佛得角、刚果(金)、加纳这些边缘球队身上。有的模型猜对了,有的错了。韩国和伊朗的出局,各家模型也是几家欢喜几家愁。
这说明什么?
AI很擅长从海量历史数据中总结规律,但在处理小概率事件和不确定性时,模型的训练偏好、实时信息摄入能力、算法架构的差异,就会暴露无遗。
世界杯预测的本质,不是"谁更懂球",而是谁更擅长在信息不完整的情况下做出判断。
这不只是足球的问题
如果把世界杯预测换成股市走势、天气变化、疫情推演,逻辑完全一样。
AI在"大部分情况"下表现优异,这已经不需要反复证明。但真正的工程挑战永远是那"小部分情况"——数据稀疏的冷门事件、规则突变的新场景、从未出现过的黑天鹅。
这恰恰是当前AI最薄弱的环节。
联想和咪咕搞的这场"人机大战",表面上是世界杯的娱乐活动,实际上做了一次很有价值的压力测试:在真实的不确定场景中,把12个主流国产大模型放在同一起跑线上比一比。结果坦诚地告诉我们——AI在大方向上可以信任,但在边缘决策上,人类判断力依然不可替代。
淘汰赛才是真正的考试
小组赛只是开胃菜。淘汰赛的变数更大:点球大战、伤病突发、战术博弈、裁判尺度……这些元素比小组赛更依赖"即时判断"而不是"历史统计"。
AI在淘汰赛阶段能不能继续保持高命中率,将是本届世界杯场外真正的看点。
对于关注AI的人来说,这比谁夺冠更有意思——它回答了一个更根本的问题:当规则从"大概率"变成"不确定",AI还能不能稳住?
答案或许要在7月的淘汰赛里揭晓。
你觉得AI能猜对最后的冠军吗?欢迎在评论区说说你的预测,也别忘了推荐给身边看球又聊AI的朋友。
热门跟贴