世界杯32强出炉！12大AI预测成绩揭晓：腾讯混元拿下第一

程序员高手之路

2026-06-30 07:06 ·上海

2026年世界杯小组赛刚打完，32强名单尘埃落定。韩国走了，伊朗也走了，传统强队基本没出什么意外。

但今年赛场外有一场更安静的较量，结果也刚公布。

12个国内AI大模型——从腾讯混元到DeepSeek，从讯飞星火到MiniMax——搞了一场世界杯预测人机大战。最终成绩单：腾讯混元29/32高居榜首，MiniMax和讯飞星火各28/32并列第二，DeepSeek、智谱、联想天禧AI各27/32紧随其后。

单看数字，AI确实有点东西。29/32的正确率，人类专家也未必能稳定做到。

但真正有意思的不是谁排第一，而是那几场"集体分歧"的预测，恰好撕开了AI能力的真实边界。

AI在确定性面前很强，但不确定性才是试金石

12家模型对巴西、德国、法国这些传统强队的晋级预测几乎完全一致。这不奇怪——历史数据充足、球队实力清晰、舆论风向明确，这类确定性高的问题正是AI的舒适区。

真正的分歧出现在波黑、佛得角、刚果（金）、加纳这些边缘球队身上。有的模型猜对了，有的错了。韩国和伊朗的出局，各家模型也是几家欢喜几家愁。

这说明什么？

AI很擅长从海量历史数据中总结规律，但在处理小概率事件和不确定性时，模型的训练偏好、实时信息摄入能力、算法架构的差异，就会暴露无遗。

世界杯预测的本质，不是"谁更懂球"，而是谁更擅长在信息不完整的情况下做出判断。

这不只是足球的问题

如果把世界杯预测换成股市走势、天气变化、疫情推演，逻辑完全一样。

AI在"大部分情况"下表现优异，这已经不需要反复证明。但真正的工程挑战永远是那"小部分情况"——数据稀疏的冷门事件、规则突变的新场景、从未出现过的黑天鹅。

这恰恰是当前AI最薄弱的环节。

联想和咪咕搞的这场"人机大战"，表面上是世界杯的娱乐活动，实际上做了一次很有价值的压力测试：在真实的不确定场景中，把12个主流国产大模型放在同一起跑线上比一比。结果坦诚地告诉我们——AI在大方向上可以信任，但在边缘决策上，人类判断力依然不可替代。

淘汰赛才是真正的考试

小组赛只是开胃菜。淘汰赛的变数更大：点球大战、伤病突发、战术博弈、裁判尺度……这些元素比小组赛更依赖"即时判断"而不是"历史统计"。

AI在淘汰赛阶段能不能继续保持高命中率，将是本届世界杯场外真正的看点。

对于关注AI的人来说，这比谁夺冠更有意思——它回答了一个更根本的问题：当规则从"大概率"变成"不确定"，AI还能不能稳住？

答案或许要在7月的淘汰赛里揭晓。

你觉得AI能猜对最后的冠军吗？欢迎在评论区说说你的预测，也别忘了推荐给身边看球又聊AI的朋友。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴