足球正变得越来越数据密集化。在职业比赛中,除了传统的摄像头之外,还有数不清的传感器、光学追踪系统,一场比赛90分钟下来,会采集到数百万个数据点,它们会用来进行比赛分析和生成内容,扩展比赛的现场体验。足球也正在变得越来越AI化。

今年夏季,四年一度的足球世界杯,将在美国、加拿大、墨西哥举办,预计将触达60亿人口,成为一场空前的足球和体育盛事。世界杯近百年的历史上,技术推动着它的发展。最近,联想CEO杨元庆与FIFA主席因凡蒂诺(Gianni Infantino)在拉斯维加斯的球体馆(Shpere)共同宣布了世界杯的AI技术方案。这一届世界杯,会不会成为一届“AI世界杯”。

在达沃斯论坛上,因凡蒂诺透露,目前全球已经有超过5亿人次发出了购票请求。他还引述了WTO的研究,2026年世界杯有望推动高达409亿美元的GDP增长,带来82.8亿美元的社会效益,并在全球范围内创造近82.4万个全职工作岗位。

对于AI来说,更重要的是如何集成到这次人类历史上最大的盛会中,给人类带来快乐。“在如今这个特殊的时期,我们常常忘记快乐,忘记喜悦。每个人都有自己的烦恼和生活难题,而我们希望通过足球,为世界各地的社区带来快乐。当孩子踢球时,当大人踢球时,他们不会去想生活中的烦恼和问题。”

约翰内斯·霍尔茨米勒(Johannes Holzmüller)是FIFA(国际足联)创新总监,17年间,他见证了FIFA从对技术的抵触,到拥抱创新,从门线技术、VAR(视觉辅助裁判)、半自动越位技术,直到足球“正在进入生成式AI世界”。

未尽研究最近在拉斯维加斯采访了霍尔茨米勒。

打开网易新闻 查看精彩图片

(图片来源:FIFA)

问:未尽研究

答:霍尔茨米勒

你加入FIFA,从事技术与创新工作,已经17年了,能否结合你个人的经历,回顾一下这些年无论是世界杯,还是足球这项全球最受欢迎的运动,技术是如何推动它不断发展、不断扩大影响力、变得越来越普及的?

这确实是一个非常有意思的问题,也是我们一直希望向媒体展示的内容之一。

如果有机会的话,欢迎有一天来苏黎世总部,那里有一个博物馆。可以展示这个问题的答案:技术是如何帮助 FIFA、帮助足球,最终成为一项真正的全球性运动的。

我们可以从最早的时候说起。最初,足球比赛只能由亲临现场的观众体验,只有到场的球迷才能真正“看到”比赛。那是 1934 年左右的时代。但随着时间推移,广播的出现、随后电视的普及,足球,尤其是职业足球,突然能够被全球数以百万计的球迷同时观看。这也是足球之所以能够变得如此受欢迎的一个非常重要的原因。

所以,技术从一开始就与足球的发展密不可分。而如果我们谈的是技术真正被集成到比赛本身、集成到场上体验中,这大约是在 16 年前开始的。

我记得我刚加入 FIFA 的时候,那还是在前一届管理层时期,当时,有一个非常明确的立场,那就是:技术不应该成为足球比赛的一部分。

是约瑟夫·布拉特(Joseph Blatter)?

是的。当时仍然固守长期以来的理解,足球只需要 22 名球员、一个或几个裁判员,以及一只足球,仅此而已。然后,2010 年南非世界杯发生了一件事,这可能是技术真正介入足球的一个非常重要的转折点。

那场比赛我记得是四分之一决赛,德国对英格兰。我是德国人,到现在我都还在想,那一球到底算不算进。球击中了横梁,弹下来。

是在门线里面。

是的,我觉得是在门线里面。所有在电视上看到回放的人都能立刻判断出,球已经越过了门线。

我当时也看了回放。唯一没法做出判断的,是场上的裁判,因为这一切发生得实在太快了。而最终,那场比赛我记得德国是 4 比 1 获胜。这次事件,真的成为了一个起点。

这是英国队员兰帕德(Frank Lampard)的那一球。这次事件后来被多次提起,因为它真正成为了 FIFA 决定引入技术作为辅助工具的起点。对 FIFA 来说,这一点非常重要:我们始终将技术视为一种“辅助工具”。

我们并不是为了技术而引入技术,也不是为了制造“FIFA 又做了什么新技术”的新闻标题。我们始终关注的是:如何提升比赛本身,如何改善足球体验——无论是场上的球员、裁判、球队、医疗人员,还是场外的球迷、现场观众以及在家观看比赛的球迷。无论是新兴技术、成熟技术,还是已有技术,只要它能够作为辅助工具帮助我们实现这些目标,我们就会去探索。

这就是起点。随后引入的是门线技术,第一套系统在 2014 年巴西世界杯正式使用,这是一个非常成功的项目。比赛中出现过一些门线事件,我记得第一个是法国队的本泽马。当时,系统在一秒之内就通过裁判手表提示“进球”。

那一刻,全世界的足球迷都意识到:技术已经成为足球比赛的一部分。

随后,技术持续演进。接下来一个重大的变革是 VAR,也就是视频助理裁判系统。从技术角度看,它本质上就是一种视频回放功能,这在电视转播中早已存在。

不同之处在于,VAR 的唯一目的,是为一组场外的裁判(位于单独的房间内)提供最佳的摄像机角度,让他们能在几秒钟内分析场上的关键事件。正如大家所知,VAR 的介入范围是有限的,只适用于四类特定情况。VAR 裁判会通过麦克风与主裁判沟通,建议主裁判前往场边屏幕再次查看,并最终由主裁判自己做出决定。

这是第二个重大里程碑。目前,全球已有 80 多个会员协会、超过 80 个国家、1000 多项赛事已经使用或曾经使用 VAR,几乎是在每周、每天为裁判提供支持。

接下来一个重要阶段始于 2015 年。当时我接到一家公司的 CEO 的电话,他告诉我他们有一项非常有意思的技术研发成果,那就是追踪技术,这直接推动了半自动越位技术的发展。

区别在于,自卡塔尔世界杯以来,我们开始追踪场上全部 22 名球员,每名球员 29 个数据点,每秒 50 次采样。这意味着每场会产生数以百万计的数据点。

此外,我们还在比赛用球中嵌入了传感器,即 IMU 惯性测量单元,用于测量每一次触球。为什么这对足球如此重要?因为像手球、越位这样的规则,对“球在什么时候被触碰”这一时间点的判断,精确到毫秒级至关重要。只有在那个瞬间,我们才能分析球员的所有三维数据,迅速判断球员是否处于越位位置。

在卡塔尔世界杯上,这套系统为 VAR 裁判提供了额外的信息,系统会自动识别越位情况,VAR 裁判可以立即核实,从而显著缩短越位判罚所需的时间。

也就是说,VAR房间和场上裁判之间是实时通信的?

是的,VAR 可以与主裁判直接沟通,主裁判也可以与 VAR 实时交流。

展望 2026 年世界杯,我们希望把这一切提升到新的水平。足球不像网球等项目,很多时候球员之间距离非常近,容易被其他球员、足球或球门遮挡。

因此,我们认为,为了让半自动越位判罚更加精确,我们需要在现有数百万数据点的基础上再进一步。我们与联想合作,开发了一个数字资产平台。作为第一步,在 2026 年世界杯之前,所有球员都会在参加首场比赛前进行一次扫描。现在这个扫描过程只需要一秒钟,通过数百台摄像机同时完成。所有信息都会存储在 FIFA–联想数字资产平台中。

在这个平台上,每一名球员都会生成一个数字化的 3D 形象(Avatar),并可供不同的利益相关方使用。其中一个重要应用场景当然是半自动越位判罚,因为这能为我们提供球员身体尺寸的极其精确的信息。在越位判罚中,很多时候差距只有几厘米,甚至几毫米。

我们相信,通过这些扫描,能够让已经在卡塔尔世界杯中取得巨大成功的半自动越位系统更加精确,也能让裁判在比赛中更快获得可靠的信息。我们在去年世俱杯上测试过一种方案:当系统达到 100% 的置信度时,越位信息会直接发送到主裁判和助理裁判的手表上。这只有在系统对球员位置极度确信的情况下才会发生,而 3D 扫描为这种高置信度提供了支持。

这些 3D 虚拟形象在球迷互动方面也非常有吸引力,有很多潜在应用场景。例如虚拟现实体验,将在 2026 年世界杯中提供给转播商和媒体版权方。

你能否举几个具体的应用例子?

当然。比如在 2022 年世界杯中,当出现越位判罚时,通常在 30 秒左右会在电视上播放一段 3D 回放。但那时的回放中,球员只是没有面部和皮肤的灰色通用模型。

在有了这些扫描之后,2026 年世界杯的 3D 回放将变得非常逼真,更有助于全球球迷理解复杂的判罚场景。球员将真正“看起来像球员”。

除了越位判罚,这些Avatar是否也能用于点球或犯规判罚?

不用于犯规判罚。犯规涉及主观判断,仍然由裁判决定。如果一名球员轻微接触另一名球员,对方倒地,是否构成点球,仍取决于裁判的判断。

我们目前提供技术支持的,是所有“事实性信息”。比如我们正在测试的出界判罚技术,只要是事实判断,就可以把信息传递给 VAR。

另一个重要应用是,我们现在可以实时在 3D 中重建整场比赛。目前 VAR 已经可以实时获得守门员视角的 3D 画面。这对于判断是否存在“视线干扰”非常重要。比如当一名球员在射门瞬间挡在守门员前方,通过守门员视角的 3D 重建,我们可以快速判断是否构成越位干扰。

此外,球队分析师也非常希望使用这些 3D 重建数据,从新鲜的角度分析比赛。以前他们只能通过摄像机画面,现在可以从球员视角回看比赛,这为战术分析和赛前准备提供了全新可能。

当然,对球迷而言也是如此。比如在世俱杯上展示的“桌面观赛体验”,球迷戴上 VR 眼镜,就能在桌面上以任意角度观看比赛。这种实时 3D 重建为未来创造了大量新机会,而我们与联想共同打造的 3D Avatar 和数字平台,是这一发展的关键基础。

这些数字资产,某种程度上可以被视为比赛的模拟吗?

是否称之为“模拟”取决于你的定义。更准确地说,它是对真实比赛的复现(replication)。是对场上真实发生的一切的复现,因为我们拥有所有这些数据。

那这些数据是否可能被用于足球电子竞技?

是否用于电子足球我不能确定,那不在我的职责范围内。但可以肯定的是,这些虚拟形象在未来有非常多的潜在应用场景。

除了辅助裁判判罚,还有其他AI相关的应用场景吗?

最重要的一点是,通过 3D Avatar,我们正在进入虚拟世界。而更重要的是,足球,尤其是 FIFA,正在进入生成式 AI 的世界。

从长期来看,这可能会彻底改变比赛分析、赛前准备,甚至决策方式。以 2022 年世界杯为例,每场比赛结束后,我们会向球队提供一份大约 60 页的数据报告,包含我们收集的所有数据和统计信息。因为我们拥有数百万数据点,我们希望从中提炼洞察并呈现给球队。

未来,我们希望球队不必再手动浏览大量录像和数据,而是通过生成式 AI,更高效地理解比赛、做出决策。

比赛分析师、主教练、助理教练都可以用日常语言直接向我们开发的这个“虚拟比赛助手”提问。这个助手是我们与联想一起合作开发出来的Football AI Pro。也就是说,每场比赛结束后,各支球队都可以就他们在世界杯上踢过的比赛提出任何问题。这带来一个巨大变化,尤其是在提升决策质量以及节省时间方面。它会显著加快获得各种洞察的速度。同时,它也会解锁新的洞察,因为如今生成式 AI 的工作方式能够补充更多信息。你可能会问,这对 FIFA 为什么重要?

现在的世界杯有 48 支球队。既有预算很高的球队,也有一些球队,尤其是第一次参赛、预算相对更少的球队。随着技术对所有球队越来越重要,这意味着预算更高的球队会获得额外优势,因为他们不仅有更多的人力资源、更多专家,也能使用最新的技术。

我们想实现的目标,是把同样的技术免费提供给所有球队。这意味着,不管你带着 1 名比赛分析师来世界杯,还是带着 20 名比赛分析师来,你都能获得同样的工具。教练、助理教练、比赛分析师都可以用他们的日常语言,把问题直接问给这个虚拟比赛助手系统。

这对我们来说非常重要,因为我们相信,正如我之前说的,从中长期来看,这将改变准备比赛、分析比赛的方式。

打开网易新闻 查看精彩图片

(在达沃斯世界杯论坛上,因凡蒂诺说:世界处于特殊时期,世界杯将会给人们带来快乐,忘记烦恼。 图片来源:FIFA )

你刚才提到2022年卡塔尔世界杯。四年之间,AI 领域出现了巨大变化,出现了ChatGPT。从技术角度看,这是一种划时代的变化,可能会改变足球的未来,也会改变 FIFA世界杯。你期待 2026 年夏天会发生一些具有“改变游戏规则”意义的事情吗?

是的。正如我刚才解释的,我认为我们所说的这个Football AI Pro,也就是面向球队的足球 AI 专业助手,将会是生成式 AI 在足球领域的第一步。它不会在明天就改变一切,但我认为这是一条重要的起点。

因为在我们的日常生活里,我想在全世界范围内,我们都越来越多地使用这些大语言模型工具来即时获得我们需要的信息。这当然会成为一个重要的变化,并且从中长期来看,会是一个“改变者”。

另一个重要项目,是我们在 FIFA 俱乐部世界杯上已经非常成功测试过的裁判摄像机。在俱乐部世界杯上我们把它称为“Referee View”(裁判视角)。在联想的支持与帮助下,我们开发了一套稳定软件。

为什么这很重要?因为你可能已经看到过,每次我们展示裁判摄像机的回放视角时都非常令人兴奋,球迷非常喜欢,因为它让人感觉像是在场上,也让人能够理解裁判当时看到的是什么。但过去,尤其当裁判在奔跑时,画面会非常抖。

现在,通过联想的这项技术,我们可以让这类画面在用于回放时稳定得多。画质更好之后,我们也能更频繁地使用这种视角。因此,这就是我们提到的三个关键点:扫描、裁判视角、以及生成式 AI,在这里 AI 都扮演了相当重要的角色。

对我们来说很重要的一点是“普惠化(democratize)”:当涉及生成式 AI 时,我们要真正让所有球队都能获得使用权;当涉及面向球迷的体验时,我们也希望把这些能力提供给所有球迷。至于裁判视角、球员扫描也是一样,我们使用 AI 来生成这些分析内容,并且这些能力不仅用于裁判判罚,也用于很多不同的应用场景。

你们打算如何实现这些技术的普惠化?这些技术在高水平赛事中当然很昂贵,但基层足球、社区比赛、大学联赛也有很多人参与。它们有没有可能以更可负担的方式使用这些技术?毕竟那里踢球的人更多。

一个很好的例子是 VAR。我刚才提到我们实施了 VAR,我记得第一次在比赛中使用视频回放是在 2016 年。到今天为止,我们已经有超过 80 个会员协会、全球 80 多个国家在使用 VAR。

但我们也看到,现在差不多到了一个上限。原因是什么?许多会员协会在人员和预算方面缺乏资源。因此我们就在思考:怎样才能让视频回放技术也能在预算更低的赛事中使用?

我们目前正在测试一项叫做Football Video Support(FVS)的技术,不需要完整的 VAR 团队,因此需要的人力更少,同时技术部署也非常简化。我们正在测试的方式是:双方教练各有两次申请机会,在特定情境下提出请求,然后裁判可以到场边去查看画面并做出判断。

我们会努力把世界杯上使用的技术简化,让这些支持性技术工具尽可能提供给更多会员协会。至于各会员协会把这些技术用到什么层级,是他们自行决定的:可能只用于顶级职业联赛,也可能用于二级、三级联赛等等。但至少我们有一个明确的使命——这一点也得到我们主席的支持——就是要普惠化这些技术,并让尽可能多的人能够使用。

从实体规模来说,这将是历史上最大的足球赛事,不仅是足球史上,也是体育史上,甚至可能是人类历史上最大的事件。48 支球队、三个国家联合举办、39 天时间、预测将触达 60 亿人口、决赛达 20 亿人口。但在数字层面,你们有没有类似的衡量指标?它会有多大?

有的,我们一直都有。我们有一个数字部门,专门做这件事。他们会分析观看人数,也会分析有多少人被触达,有多少人与 FIFA 发生了互动,并且会覆盖所有社交媒体平台上的内容互动。这是我们正常工作流程的一部分。

我认为这次的数字规模会大到我们现在难以想象,因为它会是最大的。

关于FIFA与联想的官方技术合作伙伴关系,你们如何评估这种合作?你们遇到并克服的最大挑战是什么?

这是个非常好的问题。我给你讲一个我们日常工作中的真实情况。FIFA 是世界足球的管理机构,我们是体育组织,但我们不是科技公司。

你还记得我一开始说的吗?我们会先识别问题,识别挑战,试图解决这些问题、改善足球体验,让全世界的新受众、新一代球迷受益。我们相信技术能帮我们很多。但当我们识别出这些问题后,就会到一个节点:要解决它们,我们需要合作伙伴。因此我们需要一个科技合作伙伴,因为我们不是科技公司。

所以一开始合作时,一边是世界上最优秀的科技提供商之一,一边是像我和同事们这样非常懂足球的专家。我们最初遇到的最大挑战,是我们要能讲同一种语言:我们讲“足球语言”,联想讲“技术语言”。把这两者融合在一起需要时间。

但我认为,从今天将要发布的产品,以及它们将在世界杯上被使用这一点来看,我们已经跨过了这道坎。我们实现了真正的协作:技术专家和足球专家一起解决问题。

所以,我会说最大的挑战就是:我们在谈论足球问题时,需要把它翻译成技术问题;反过来,联想也需要用接近足球的方式告诉我们他们的能力,以及这些能力能解决什么问题。这并不是瑞士德语、德语、英语或中文这种语言差异,而是问题表达方式的差异。

现在,经过 14 个月的合作,我们确实实现了这一点。我们和联想都为此感到非常自豪,因为回头看,这是非常了不起的成果。而把这些成果带到世界杯——这项史上最大的体育赛事——意义非常重大。

我们能把这届赛事称为 “AI World Cup(AI 世界杯)”吗?

这是个很好的问题。我不会把它称为 “AI 世界杯”,因为归根结底,一切还是关于足球。我们在这里,是因为每个国家最好的球员来到这里,相互对抗。场上 11 对 11,中间一只球。这个游戏每个周末、每周都在全世界上演:孩子们踢、基层踢、各个级别都在踢。

所以我更愿意说,AI 是这届世界杯的赋能者,它帮助我们带来最好的足球体验:给场上的球队、球员、裁判,也给场外的球迷,无论是在现场还是在家里观看。

对我来说,AI 是让足球体验更进一步的推动力。但世界杯本身仍然是关于比赛,是关于球员,是关于谁成为世界冠军。你也知道,世界杯有一种非常特殊的感觉。我太太不是足球迷,但世界杯一开始,那种感觉就不一样了。比赛有一种魔力。很多平时不看足球的人也会开始看,大家为自己的国家感到自豪,一起庆祝,团结不同的人群。我认为这才是它的本质。