打开网易新闻 查看精彩图片

粒子物理学的新探索之路

1930年,年轻物理学家卡尔·安德森受导师委托测量宇宙射线的能量。1932年,他在改进的云室装置中发现了一种奇异的粒子——它同时具有质子和电子的性质。安德森意外发现了反物质,并因此在31岁时获得了诺贝尔奖。四年后,他又发现了另一种基本粒子——μ子。

数十年来,粒子物理学家建造了越来越精密的探测仪器。其中最先进的是大型强子对撞机(LHC),这个周长27公里、跨越法瑞边境的地下环形装置在2022年开始第三次运行。物理学家希望通过让亚原子粒子以接近光速碰撞来探索宇宙的深层奥秘,但他们往往不知道会发现什么。

标准模型框架已在1970年代确立,描述了目前已知的所有基本粒子。然而,新的基本物理现象变得越来越难以捕捉。我们已经采摘了最容易得到的果实,现在需要更大更精密的仪器、更详细的数据和更快更灵活的分析工具。这些分析工具包括机器学习——一种人工智能形式,可以找到人眼无法察觉或极其罕见的数据模式。

海德堡大学理论物理学家蒂尔曼·普莱恩指出:"粒子物理学正面临危机。"大型强子对撞机和其他高能物理设施的实验结果未能产生关于新物理的发现。许多理论学家期待的模型并未被验证。汉堡大学物理学家格雷戈·卡西耶茨卡回忆,2008年LHC刚启动时,物理学界对超对称性理论充满乐观,认为"打开对撞机,超对称性会跳出来"。但18年过去了,超对称性仍停留在理论层面。

为应对这一困境,研究人员开始探索无监督学习——一种新的机器学习方法。与传统方法不同,无监督学习不是教授AI识别特定预测(如某个质量和电荷的粒子),而是让AI发现任何异常或有趣的事物,这可能预示全新的物理现象。这相当于用全新的目光观察星空或池塘的切片样本。

标准模型仍留下许多未解之谜:物质粒子为何具有它们现有的质量?中微子为什么有质量?传递重力的粒子在哪里?为什么物质比反物质多?是否存在额外维度?暗物质是什么?回答这些问题中的任何一个都可能开启通往标准模型之外新物理的大门。

无监督学习的应用

普莱恩和一位在软件公司SAP工作的朋友讨论了自编码器——一种无监督学习算法。他的朋友指出,SAP用自编码器检测网络入侵:当一台计算机的网络流量突然改变时,说明它被黑客攻击了。自编码器是神经网络,能将输入数据压缩后再解压缩,使输出尽可能接近输入。但当数据包含相对罕见的项目(如白虎或被黑客入侵的计算机)时,网络表现更差,因为练习机会较少。输入与重建之间的差异因此可以表示该输入的异常程度。

"你可以完全使用我们的软件,"那位朋友说,"这完全是同样的问题。只需用粒子替换计算机。"两人便提出了联合资助提案:将自编码器应用于对撞机数据,询问是否存在与众不同的粒子。

但AI能否发现新物理并非既定。即使定义什么是"有趣的"也是一个艰巨的障碍。早在1800年代,实验室的男性物理学家就将数据处理工作委托给被视为勤奋细心的女性。女性标注星星照片,充当"计算机"。20世纪50年代,女性被训练扫描气泡室图像。但正如哈佛科学史学家彼得·盖利森在《形象与逻辑》一书中所述,这项任务"微妙、困难、绝非程序化",需要"三维视觉直觉"和判断力——这不是算法活动。

过去十年,我们学到AI系统确实可以执行曾被认为需要人类直觉的任务,如掌握围棋。因此研究人员一直在测试AI在物理学中的"直觉"。2019年,卡西耶茨卡及其合作者宣布了LHC奥运会2020,参赛者需提交算法来在三个模拟LHC数据集中找到异常事件。有些团队在一个数据集中正确找到异常信号,但在第二个数据集中错误报告,在第三个中全部失手。2020年,名为"暗机器"的研究集体宣布了类似竞赛,吸引了超过1000份机器学习模型提交。评分方式不同导致排名不同,表明探索未知领域没有最优方法。

另一种测试无监督学习的方式是重写历史。1995年,顶夸克在费米国家加速器实验室的Tevatron被发现。但如果它当时没被发现呢?研究人员将无监督学习应用于2012年收集的LHC数据,假装对顶夸克几乎一无所知。果然,AI揭示了聚集在一起的异常事件集合,结合人类直觉,它们指向类似顶夸克的东西。

这个练习强调了无监督学习还不能取代物理学家。卡西耶茨卡问道:"如果异常检测器检测到某种特征,你如何从该声明进展到物理解释?"异常搜索更多是一种侦察策略,引导你查看正确的角落。哥伦比亚大学物理学家乔治亚·卡拉焦基表示同意,"一旦发现意外,你不能就此停止说'我发现了什么',"她说,"你必须提出一个模型然后测试它。"

参与2012年希格斯玻色子发现的威斯康星大学麦迪逊分校物理学家兼数据科学家凯尔·克兰默也认为人类专业知识不能被忽视。"数据看起来不同于预期的方式有无穷无尽的可能性,"他说,"大多数都不有趣。"物理学家可能能够认出偏差是否暗示某种可信的新物理现象,而非噪声。"但如何编码这一点并在算法中明确表达要直接得多。"克兰默说。理想情况下,指导方针足够通用以排除难以想象的,但不排除仅仅是未想象的。"那将是你的金发女孩局面。"

AI如何可能错过或伪造新物理

盖利森在其1987年著作《实验如何结束》中写道,科学仪器可以"输入内置于仪器本身的假设"。他讲述了一个1973年寻找中性流的实验,该现象由缺少所谓重电子(后更名为μ子)表示。一个团队最初使用来自以前实验的触发器,仅当它们产生重电子时才记录事件——尽管中性流根据定义不产生任何。结果,研究人员一段时间内错过了该现象并错误结论它不存在。盖利森说物理学家的设计选择"允许只发现一件事,并使下一代人对这项新发现视而不见。当你有选择性时,这始终是风险。"

我问盖利森,通过自动化搜索有趣事件,我们是否将科学的钥匙交给了机器?他重新措辞问题:"我们是否将科学汽车的钥匙交给了机器?"缓解这类关切的一种方法是生成测试数据查看算法是否表现如预期——如LHC奥运会。"在你拿出相机拍摄尼斯湖怪物之前,你想确保它能准确重现各种颜色和图案,"他说,以便你能依赖它捕捉任何出现的东西。

盖利森(也是物理学家)在事件视界望远镜项目上工作,该项目成像黑洞。对于该项目,他记得放置了完全意外的测试图像,如Frosty雪人,以便科学家能探测系统捕捉新东西的通用能力。"危险是你错过了某个关键测试,"他说,"以及你将要拍摄的对象与你的测试模式如此不同,以至于你毫无准备。"

物理学家用于寻求新物理的算法肯定容易受到这种危险影响。值得注意的是,无监督学习已在许多应用中使用。在工业中,它正表面异常信用卡交易和黑客网络。在科学中,它识别地震前兆、蛋白质结合的基因组位置和合并星系。

但粒子物理数据的一个区别是异常可能不是独立对象或事件。你寻找的不仅仅是干草堆中的针;你也在寻找干草堆本身的微妙不规则性。也许一堆包含比预期更多的短茎。或图案仅当你同时查看茎的大小、形状、颜色和纹理时才显示自己。这样的图案可能暗示土壤中的未承认物质。在加速器数据中,微妙模式可能暗示隐藏力。正如卡西耶茨卡及其同事在一篇论文中所写,"我们不在寻找飞行大象,而是在当地水坑寻找比通常更多的大象。"

即使权衡许多因素的算法也可能错过信号——它们也可能看到虚假信号。错误声称发现的赌注很高。回到黑客情景,普莱恩说一家公司可能最终确定其网络未被黑客攻击;只是一名新员工。算法的误报造成的伤害很小。"但如果你站在那里获得诺贝尔奖,一年后人们说'好吧,这是侥幸',人们会嘲笑你一辈子,"他说。在粒子物理中,你冒着在大数据中纯粹偶然发现图案或由于设备故障而失败的风险。

误报以前发生过。1976年,由后来因其他工作赢得诺贝尔奖的莱昂·莱德曼领导的费米实验室小组宣布发现他们暂时称为Upsilon的粒子。研究人员计算信号偶然发生的概率为50分之一。但在进一步数据收集后,他们撤回了发现,戏称伪粒子为"哎呀-莱昂"。(今天,粒子物理学家等到发现是侥幸的概率降低到350万分之一——所谓的五西格玛标准。)2011年,意大利乳剂跟踪装置振荡项目实验宣布了中微子超光速旅行的证据。几个月后,他们报告结果是由于计时系统中的故障连接。

这些警示故事在物理学家心中挥之不去。然而,虽然研究人员对AI的误报持谨慎态度,但他们也将其视为防护措施。迄今为止,无监督学习尚未发现任何新物理,尽管已在费米实验室和欧核组织多个实验的数据上使用。但异常检测可能已防止了像OPERA那样的尴尬。"所以与其告诉你有新物理粒子,"卡西耶茨卡说,"它告诉你,这个传感器今天表现异常。你应该重启它。"

为AI辅助粒子物理的硬件

粒子物理学家不仅在突破计算软件的极限,也在突破计算硬件的极限。这个挑战是前所未有的。LHC每秒产生4000万次粒子碰撞,每次都可能产生1兆字节的数据。即使你能这么快保存到磁盘,这也太多信息了。因此两个最大的探测器各使用两级数据过滤。第一层称为第1级触发器(L1T),每秒收获10万个事件;第二层称为高级触发器(HLT),选择其中1000个事件保存以供后来分析。因此只有四万分之一的事件可能被人眼看到。

HLT使用桌面计算机中的中央处理器(CPU),运行复杂机器学习算法分析碰撞。L1T作为第一道防线必须快速。因此L1T依靠称为现场可编程门阵列(FPGA)的集成电路,用户可以为专门计算重新编程。权衡是编程必须相对简单。FPGA不能轻易存储和运行花哨的神经网络;相反,它们遵循关于粒子碰撞什么特征使其重要的脚本规则。在复杂程度上,这是给扫描气泡室的女性的指令,而非女性的大脑。

麻省理工学院粒子物理学家叶卡捷琳娜(卡蒂亚)·戈沃尔科娃看到了改进LHC过滤器的途径,灵感来自棋盘游戏。大约2020年,她通过比较LHC的精确测量与预测来寻找新物理,使用很少或没有机器学习。然后她看了一部关于AlphaGo的纪录片,该程序用机器学习击败了人类围棋冠军。"对我来说启悟的时刻是AlphaGo会使用一些绝对新颖的策略,是人类玩了几个世纪的游戏都没想到的,"她说。"所以那时我想,我们在物理学中需要类似的东西。我们需要一个能以不同方式看待世界的天才。"

戈沃尔科娃及其合作者找到了一种方法来压缩自编码器以将其放在FPGA上,它们每80纳秒处理一个事件(少于百万分之一秒)。(压缩涉及删除一些网络连接并降低一些计算的精度。)他们在2022年《自然机器智能》中发表了他们的方法,研究人员现在在LHC第三次运行期间使用它们。新触发器技术安装在LHC巨大环周围的一个探测器中,发现了许多会被遗漏的异常事件。

研究人员目前正在建立分析工作流来破译为什么事件被认为异常。费米实验室粒子物理学家詹妮弗·恩加迪乌巴是触发系统的协调员之一,也是戈沃尔科娃的共同作者,她说一个特征已经突出:被标记的事件有大量新粒子喷射出碰撞。但科学家仍需探索其他因素,如新粒子的能量及其在空间中的分布。"这是一个高维问题,"她说。

最终他们将公开分享数据,允许他人目测结果或在寻求模式的过程中应用新的无监督学习算法。加州大学圣地亚哥分校物理学家哈维尔·杜亚特和2022年论文的共同作者说,"提供给粒子物理学家社区说'嗯,我们不知道这是什么。你可以看一下',这种想法令人兴奋。"杜亚特和恩加迪乌巴注意到高能物理传统上遵循自上而下的发现方法,针对明确定义的理论测试数据。加入这项新的自下而上的对意外的搜索标志着新范例。"也是在某种程度上回到标准模型建立之前的时代,"杜亚特补充道。

但在我们知道为什么AI标记这些碰撞异常之前可能需要数年。他们能支持什么结论?"最坏的情况是,它可能是一些我们不知道的探测器噪声,"恩加迪乌巴说,"这仍会是有用的信息。最好的情况可能是新粒子。然后新粒子暗示新力。"

杜亚特说他期望他们与FPGA的工作有更广泛的应用。"高能物理中的数据速率和约束如此极端,以至于业界人士不一定在从事这项工作,"他说。"在自动驾驶汽车中,通常毫秒延迟足以作为反应时间。但我们正在开发需要在微秒或更少时间内响应的算法。我们处于这个技术前沿,看看有多少可以扩散回业界将很酷。"

普莱恩也在与实验学家、电气工程师和其他理论家合作,将神经网络放在FPGA上用于触发器。将抽象理论的细微差别编码为物质硬件是个谜题。"在这份资助提案中,我谈得最多的人是电气工程师,"他说,"因为我必须问工程师,我的哪个算法能装进你该死的FPGA?"

硬件很难,加州大学圣地亚哥分校电气工程师兼计算机科学家瑞恩·卡斯特纳说,他与杜亚特一起从事FPGA编程。允许芯片如此快速运行算法的原因是它们的灵活性。工程师不是用Python这样的抽象编程语言编程,而是配置底层电路。他们手工映射逻辑门、路由数据路径并同步操作。这种低级控制也使工作"痛苦地困难",卡斯特纳说。"就像你有很多绳子,很容易上吊自己。"

在中微子中寻求新物理

下一个新物理可能不会出现在粒子加速器。它可能出现在中微子探测器。中微子是标准模型的一部分但仍深不可测。中微子很小、电中性,且非常轻,以至于没人能测量它们的质量。(最新尝试在4月设置了大约电子质量百万分之一的上限。)在所有已知有质量的粒子中,中微子是宇宙最丰富的,但也最幽灵,很少承认周围的物质。每秒数十万亿穿过你的身体。

但如果我们仔细聆听,我们可能刚好听到它们要讲述的秘密。哥伦比亚的卡拉焦基选择了这条发现之路。在她访问哥伦比亚大学位于曼哈顿以北约20公里的大庄园Nevis实验室时,做物理学家"有点像玩侦探,但你创建自己的谜团,"她告诉我。物理研究在第二次世界大战后开始于该地点;一个大厅展示了回到1951年的论文。

卡拉焦基急切期待一个大规模中微子探测器,目前正在建设中。从2028年开始,费米实验室将向西通过1300公里的岩石向南达科他州发送中微子,它们偶尔会在深层地下中微子实验(DUNE)中表明自己的存在。为什么这么远?当中微子旅行长距离时,它们有奇怪的习惯振荡,从一种或"风味"转变为另一种。观察中微子和它们镜像反粒子的振荡,可以告诉研究人员有关宇宙物质-反物质不对称的事情——标准模型不解释——因此,根据Nevis网站,"为什么我们存在。"

"DUNE是促使我开发这些实时AI方法的原因,"卡拉焦基说,"用于极其迅速筛选数据并试图寻找其中感兴趣的稀有签名。"当中微子与探测器的70000吨液体氩相互作用时,它们会产生其他粒子的阵雨,创建看起来像烟火照片的视觉轨迹。

标准模型编目了已知基本物质粒子和控制它们的力,但留下了主要谜团未解。

即使不是不断用中微子轰击DUNE,研究人员也将继续收集数据,以防万一它捕捉到来自遥远超新星的中微子。"这是一个大规模探测器每秒涌出5太字节数据,"卡拉焦基说,"它将持续运行十年。"他们将需要无监督学习注意没人在寻找的签名,因为有"许多不同模型关于超新星爆炸如何发生,就我们所知,对中微子的模型没有一个可能是正确的,"她说。"在如此不确定的基础上训练你的算法远不是理想。所以能识别任何类型干扰的算法将是胜利。"

实时决定保留哪百分之一数据将需要FPGA。卡拉焦基的团队准备为DUNE使用它们,她带我到一个计算机实验室,他们在那里编程电路。在FPGA实验室,我们查看坐在桌子上的不显眼电路板。"所以我们提议的方案是,对于DUNE深地,你可以有大约一百个这些板接收逐帧的图像数据,"她说。这个系统可以告诉研究人员给定的帧是否类似电视静、烟火或介于两者之间。

中微子实验,如许多粒子物理研究,是极其可视的。当卡拉焦基是博士后时,中微子探测器的自动图像处理仍在起步,所以她和合作者经常诉诸视觉扫描(气泡室风格)来测量粒子轨迹。她仍要求本科生作为教育练习进行手工扫描。"我认为仅仅让他们编写机器学习算法是错误的。除非你能实际可视化数据,否则你真的没有获得你在寻找什么的意义,"她说。"我认为能够可视化不同类型相互作用并看到什么是正常和什么不正常的创意也有帮助。"

回到卡拉焦基的办公室,公告板显示费曼图认知艺术展的图像,设计师爱德华·托夫特创建了物理学家理查德·费曼的粒子相互作用示意图的线框雕塑。"有趣的是,你知道吗,"她说。"它们看起来就像涂鸦,对吧?但实际上,它们量化编码了自然中的预测行为。"稍后,卡拉焦基和我花了很好10分钟讨论计算机或人类能否在不知道沃尔多看起来像什么的情况下找到沃尔多。我们也触及1964年最高法院案件,司法部长斯图尔特最著名拒绝定义猥亵,说"我看到时就知道它。"我问把决定什么在视觉上有趣的任务交给机器似乎是否很奇怪。"有很多信任问题,"她笑着说。

在回曼哈顿的车程中,我们讨论了科学发现的历史。"我认为这是人类的本性,试图理解周围的有序世界,"卡拉焦基说。"然后你自动挑出异常。有些人比其他人更迷恋异常,然后试图理解它们。"

思考标准模型,她称其为"美丽和优雅",具有"令人惊异的预测力。"但她发现它既有限又限制性,使我们对还看不到的颜色失明。"有时既是祝福也是诅咒,我们设法开发了如此成功的理论。"

Q&A

Q1:无监督学习是什么,它在粒子物理中有什么应用?

A:无监督学习是一种机器学习方法,不教AI识别特定预测,而是让它发现任何异常或有趣的模式。在粒子物理中,它用于在大型强子对撞机产生的海量数据中寻找意外现象,这些现象可能暗示标准模型之外的新物理,如未知粒子或隐藏的力。

Q2:自编码器如何帮助发现新的物理现象?

A:自编码器是一种神经网络,通过压缩后再解压缩数据。当数据包含罕见的异常项目时,网络表现较差。这使得输入与重建之间的差异能够表示该事件的异常程度。在粒子物理中,异常程度高的碰撞事件可能代表新粒子或物理现象。

Q3:AI的异常检测真的能发现新物理吗?

A:目前还不能保证。AI可能遗漏信号或检测虚假信号。即使AI发现异常,物理学家仍需人工分析来理解其物理含义。此外,数据中的噪声或仪器故障也可能被错误识别为新物理。因此AI更多是一种侦察工具,最终发现仍需人类的科学判断。