打开网易新闻 查看精彩图片

●作者|竹铭

●编辑|之上

这届美加墨世界杯开始五天后,随着强队尽数登场,已经开始渐入佳境。

佛得角0:0打平身价世界第一的西班牙,门将沃齐尼亚做出7次神奇扑救,舞台只有90分钟,非洲海岛的老将准备了40年。德国7:1大胜库拉索,成为本届世界杯开赛以来分差最大的比赛,德国依旧是三四线球队最严厉的“父亲”。

而今天,阿根廷3:0战胜阿尔及利亚,梅西年近40岁依然上演帽子戏法,世界杯进球数并列克洛泽达到历史第一。这一刻,梅球王的球迷是这个星球上最幸福的人。

但对围观群众和世界杯球迷来说,这届世界杯还有一件事同样让人兴奋:看AI预测比赛,居然越来越像那么回事了。

场上球队在踢,场下12个大模型搞了个“世界杯预测人机大战”(该活动由联想与咪咕发起)。不再依靠章鱼哥保罗预测来娱乐的人类,用AI开始认真预测比赛。截至6月15日,15场打完,百度文心命中7场,暂列排第一,已经显露出“预言帝”气质,紧随其后的联想天禧AI、腾讯混元、MiniMax都是命中6场,千问命中5场,Kimi命中4场。

打开网易新闻 查看精彩图片

某种程度上来说,AI在预测体育赛事这类复杂问题上确实有它的一套优势。人看球往往靠经验和感觉,AI能把过去几十年的数据全“翻”出来,再把实时信息一秒不落的跟上,相当于在帮人做预判过程中,多了一个“外脑”。

当然了,AI预测比赛也不仅仅是靠算法和算力,更要看背后的积累和沉淀。文心这次排第一,跟24年前就开始打基础有关。就像世界杯上闪闪发光的球员们一样:从来没有横空出世,只有厚积薄发。

打开网易新闻 查看精彩图片

从“老球迷”变“预言家”

先说说6月15号那场球。

科特迪瓦时隔12年重返世界杯,预选赛10战不败且一球没丢,气势确实生猛。但对面的厄瓜多尔是南美劲旅,整体实力和大赛经验都占优。赛前外界普遍觉得这俩队有的打,谁赢都不意外。结果科特迪瓦用一场极致的防守反击,1:0拿下开门红。

12个模型里,只有文心一家押中了这个比分。其他7个主流模型,DeepSeek、通义千问、Kimi、智谱清言、MiniMax、讯飞星火、商汤小浣熊,清一色给的平局,大部分押了1:1。

打开网易新闻 查看精彩图片

双方势均力敌,算法往往倾向于规避风险。平局,某种程度上也意味着安全和求稳。反正猜平局不容易全错,模棱两可,也给结果留出了一定的回旋空间。

有人说文心胆子大,敢押冷门。但这可能不只是胆子的问题,是长期信息积累形成的底气。就像人一样,你越参与其中就知道得越多,自然就越敢做判断。

顺着时间往前看,你会发现百度很早就关注和参与世界杯了。

中文互联网有自己的记忆,一张24年前的,2002年的百度首页截图——就在“体育健身”那一栏下面写着“世界杯”三个字。

打开网易新闻 查看精彩图片

2002年有点特殊。世界杯第一次来亚洲举办,中国队第一次打进世界杯正赛。全民兴起看球热潮,百度在搜索首页加了个导航入口,把世界杯相关的信息系统地收录进来,方便用户从这个“窗口”看世界杯。

从2002年开始,百度对世界杯的关注就没停过。一届接一届,四年又四年。

到了2014年,百度已经用AI做过一次世界杯预测。48场小组赛28场正确获得58.33%的预测准确率,超过微软的56.25%。淘汰赛16强和八强全部命中,四强全对。而半决赛精准预测了巴西对德国的赛果。那一年微软、谷歌、高盛都下场了。百度和微软押对了全部四强,谷歌在四强预测里只准确预测到三支队伍。

12年前就能做到这个水平,说明百度AI对世界杯的理解早就开始了,而且比较深厚。

到了2026年,人类进入大模型时代的第一届世界杯。文心代表百度出战,不负众望地站到了预测榜第一的位置。

从2002年的导航入口,到2014年将AI融入预测,再到2026年登上国内主流大模型预测榜一。拉长时间看,百度几乎每一届世界杯都没有缺席。到现在,它已经以一个记录者和见证者的身份,陪伴世界杯走过了24年。所以文心这次预测排第一,不是什么突然爆发,而是厚积薄发。

那问题是,在场景里扎了20多年,就一定能预测准吗?当然不是。

光站着看没用,关键是得把看到的、听到的、搜到的所有东西都“吃透”,变成自己的判断力。这就是百度能预测准的底子。

打开网易新闻 查看精彩图片

底子吃得厚,才能算得准

文心能赢,首先是因为它“见多识广”。

2002年开始,百度就在报道和收录世界杯的各类信息。比赛结果、进球细节、球员状态、球队战术、赔率波动——六届世界杯、24年的数据,全部沉淀下来了。

一个看了24年球的老球迷,跟一个刚看球两年的新手,判断力能一样吗?这就是数据沉淀的厚度。

但光有数据不够。数据怎么用,和数据有多少是同样重要的。

百度的不同在于,它是做搜索出身的,而搜索的核心是理解。用户搜“梅西伤了没”,你得先明白他在问什么,然后从海量信息里找到最相关的答案,再排好序给出来。这套理解、筛选、排序的功夫,百度练了20多年。

百度文心的深度搜索能力,就是这套逻辑的延续和智能强化。这套预测能力背后所依托的文心5.1尤其擅长深度搜索,它能实时联网搜索,不断获取最新信息,而不是靠静态数据硬算。其他模型还在翻历史的时候,文心已经在刷最新的新闻了。现场战术变没变、球员伤没伤、教练如何表态、天气怎么样、赔率怎么变、舆论怎么走——这些不是靠参数多就能算出来的,得靠实时信息抓取、快速理解。

这就是搜索底子的深度。

数据积累和实时搜索把信息“喂”进来了,但最终能不能做出准确判断,还得看模型本身的推理能力,推理精度能达到怎样的水平。

科特迪瓦对阵厄瓜多尔那场就是一个典型例子。其他模型多数给平局,打安全牌。文心敢给1:0,敢押爆冷,因为它能把状态、历史交锋、实时赔率这些碎片信息整合到一起,推演出一个更贴近场上走势的判断。推理精度够高,才敢把判断做细。

说到推理精度,还有一个挺有意思的例子。演员刘美含之前问过5个AI工具,“铸币坊”里的“坊”怎么读。只有文心答对了,给出的答案跟《新华字典》一致。这个例子看似跟足球预测关联不大,但本质是一回事。读对一个字,说明模型背后的知识储备够丰富,在处理精确信息时不会胡编乱造,更低幻觉、更可信。这种能力,放在世界杯预测里同样适用。

数据沉淀厚度、搜索底子深度、模型推理精度高,这三者加在一起的组合优势,才是文心跟其他模型真正拉开差距的地方。

打开网易新闻 查看精彩图片

这场长跑,百度跑了20多年

AI发展到现在,需要放到真实世界里去验证,才知道是真功夫还是花架子。

在实验室里跑分,你可以调调参数、换换数据、反复试到满意为止。但这些在可控条件下得到的结果,放到真实世界里,可能一碰就碎,面临更复杂的变量和不确定性。世界杯就是这样一个高度真实且充满挑战的真实考场。

数十支球队、百场比赛、几亿人盯着,变量多到数不清。天气、伤病、裁判、状态、战术、运气......随便哪个小因素,就可能影响最终结果,精心算出来的预测失准。

所以在这种超级场景里能保持领先,文心能跑第一,说明它背后在数据积累、整合分析、智能判断这一整条链路上的能力确实过硬,不是花架子。

这种能力不是凭空长出来的。回看时间线,百度在2002年做世界杯导航入口,2014年用AI预测赢了微软谷歌,2026年大模型榜一。百度对世界杯的关注和参与,几乎贯穿了互联网、移动互联网和AI和大模型时代,24年的积累,也让这些能力逐渐沉淀下来。

打开网易新闻 查看精彩图片

这是一场长跑,为什么百度能攒下这种积累?往根上看,搜索是百度从第一天起就在做的事,AI是另一件百度坚持做了十几年的事。搜索所承载的海量信息和理解需求,为AI能力长成提供了天然的培育土壤,而AI又让搜索更聪明。经过长期布局,搜索和AI的优势互相交织,已经成长为百度的核心基因。

当大模型热潮到来时,这种积累开始显现出价值。相较于从零起步的探索,长期沉淀带来的经验与体系,使其在模型能力与应用落地之间形成了更顺畅的衔接。当别人还在赶着时间去训模型、做应用,而百度实际上靠着20多年的积累,次次领先一步。

参数、算力和算法或许可以在短时间补齐,但长期主义所形成这道护城河,却难以复制。

AI时代,考验的不仅仅是技术本身。大家一窝蜂追热点、抢首发、卷参数,真正沉下心来做积累的没几个。热点更迭和参数竞赛外,真正稀缺的,是持续投入的耐心,以及将技术置于真实场景中反复验证的能力。

在这一点上,百度的长期积累与现实落地似乎形成了某种交汇:20多年持续做一件事,是长期主义。在世界杯这个真实而复杂的超级场景里跑赢,是落地实战能力。

这届世界杯被称作首个AI世界杯,文心在AI预测场景里领先,也在侧面证明一个朴素的道理:那些准备时间更长的人,往往在机会来了跑得更快,更从容,无论是在世界杯,还是在科技领域,每一场赢,都是由看不到的苦功夫在日复一日的支撑。