2024年计算机科学大突破|人工智能|密码学|计算机科学|量子计算机

（示意图片，由「量子号」公众号作者使用人工智能生成，下同）

《量子》杂志（Quanta magazine）推出了年度回顾专题，本文回顾了本年度最重大的计算机科学事件，包括对大型语言模型的全新认识，以及在计算复杂量子系统方面取得的突破等等，请继续往下看。

2 024 年年末似乎是一个特别不确定的历史时期，理论计算机科学也不例外。在取得多项突破和新发现的同时，该领域也面临着自身的质疑和局限性。

例如，人工智能再次成为今年的热门话题。研究人员已经开始了解神经网络“黑盒子”中可能发生的事情，这些神经网络为 Bard 和 ChatGPT 等聊天机器人提供了动力，并证明这些系统能够真正理解它们正在处理和合成的数据。但人们也越来越感觉到人工智能的发展已经开始放缓。

计算机科学的其他领域也取得了明显的成功。经过几十年的隐藏，被称为“第五只忙碌的海狸”的难以捉摸的数字生物终于现身了。但即便如此，消息也并不全是好消息：对其继任者——第六只忙碌的海狸的初步搜寻表明，它可能隐藏在难以逾越的数学障碍之外。

纠错码——一种在发生错误时可以自行修复的数学结构——也在 2024 年崭露头角。研究人员首次证明，量子计算机必不可少的纠错技术确实有效。但另一项发现表明，某些经典纠错码从根本上说是低效的，这使人们对这一“神奇现象”的实用版本的希望破灭了。

大海狸的突破

今年夏天，一个由热心业余爱好者组成的团队找到了第五只“忙碌的海狸” ，解决了计算机科学领域最大的悬而未决的问题之一。这个问题因一种需要长时间运行的特别勤奋的计算机程序而得名，它与计算机科学和数学领域一些最深奥的悬而未决的问题有关。

这个问题涉及图灵机，这是一种最简单的计算设备，最早由艾伦·图灵设想为通用计算机的模型，现在可以很容易地在线模拟。根据其初始设置，这些机器可以永远运行，也可以在完成一定数量的步骤后停止。忙碌的海狸问题问的是：给定一定数量的控制机器的规则，机器可以运行多长时间？研究人员已经解决了具有 1、2、3 或 4 条规则（分别为 1、6、21 和 107 个步骤）的机器的这一问题，但第五个忙碌的海狸数字却困扰了他们几十年。

《量子》杂志的撰稿人本·布鲁贝克记录了一个主要由非专家组成的全球团队为找到这个数字（47,176,870）所做的努力，并证明这个数字不可能再高了。这个问题并没有任何直接的应用，但找到解决方案确实代表着一种战胜压倒性的数学复杂性的胜利——早期对第六只忙碌的海狸的搜录表明，我们可能再也看不到它了。

今年 1 月，该杂志报道了另一支由非专业人士组成的多元化团队，他们帮助解决了另一种数字难题。这次努力的重点是约翰·康威的“生命游戏”，以及寻找特定长度的重复模式。通过寻找在 19 步和 41 步后重复的模式，他们证明了生命游戏是“全周期的” ——能够在所有可能数量的步骤后重复。

通过代码让生活更美好

量子计算机一直吸引着研究人员，但尽管经过多年努力，真正有用的量子计算机仍然遥不可及。部分原因在于量子计算机的性质：量子计算机利用的是变幻莫测的量子力学，即宇宙中最微小的相互作用规则，这使得它们很容易出现重大错误。近 30 年前，研究人员发现有可能将量子比特（计算机比特的量子等价物）组合在一起，使其能够容许错误。但要实现这一目标，每个量子比特的错误率必须低于某个最低阈值。12 月，谷歌公司的一个团队宣布他们已经达到了这一水平，首次表明量子纠错码可以让这些奇特的机器成为可能（尽管短期内还不可能实现）。

《量子》杂志还在 2 月份报道了另一种新型量子纠错码，这种纠错码由非周期性拼贴构成——一组以永不重复的方式组合的形状。正如布鲁贝克所写，这种联系之所以可能，是因为对于拼贴和代码来说，“了解大型系统的一小部分并不能揭示整个系统的情况。”

量子纠错并不是今年的全部乐趣——科学家们还回答了一个关于经典纠错码的重大问题，这种纠错码可用于我们今天使用的计算机。最有前途的纠错码一直效率极低，研究人员一直在想是否有可能做得更好。20 多年过去了，答案是否定的：根本就没有办法解决这种低效率问题。

窥探量子内部

今年的许多重大发现表明，通过计算机科学的视角，即使是高深莫测的量子力学世界也能变得稍微清晰一些。微小粒子以复杂的方式相互作用，科学家们仍然很难完全理解它们的特定系统。但是，四位计算机科学家最近开发出了一种新算法，可以有效地对任何系统进行完整描述，这在该领域尚属首次。通过将数学中的优化工具与称为松弛技术的计算机科学方法相结合，该团队展示了如何快速生成任何量子系统的汉密尔顿方程——一种完全描述该系统的超级方程——只要它处于恒定温度下。

同一组研究人员最终又有了一个重大的量子发现，他们证明了温度的升高不仅会削弱被称为纠缠的粒子之间的相互作用：总有一个特定的温度会让纠缠完全消失。

另一个研究小组还表明，与这类量子系统有关的一个问题——找到它们的局部最小能级——对于量子计算机来说相对容易。这不仅是量子物理学领域令人欣喜的进展，而且还证明了量子计算机确实可以解决传统机器无法解决的有用问题。量子理论的复杂性还可以为密码学提供新的基础，以防当前的密码学在量子比特的作用下崩溃。

对人工智能的理解日益加深

人工智能可能是理论计算机科学中最引人注目、也是最容易被误解的领域。今年，以 ChatGPT 闻名的 OpenAI 发布了其 o1 聊天机器人模型，这些模型似乎能够实现令人惊讶且功能强大的创新壮举。但尽管取得了这些进展，这些工具的内部工作原理仍不清楚，为安全漏洞和其他诡计留下了空间。

研究人员特别好奇的是，这些模型是否真正理解它们在说什么，或者它们只是“随机鹦鹉”” ，用 2021 年的一篇论文的话来说，就是简单地重复他们之前听到的内容的变化。新的研究表明，这些机器可能真的理解。当谷歌 DeepMind 的一个团队研究这些语言模型完成其非凡壮举所需的技能时，他们得出结论，这些机器不可能只是简单地重复训练数据。“他们令人信服地证明，某些模型可以生成结合技能和主题的文本，而这几乎可以肯定不会出现在训练数据中，”人工智能先驱杰夫·辛顿说。辛顿因其在机器学习方面的贡献获得了 2024 年诺贝尔物理学奖。

事实上，一种被称为grokking的现象表明，理解这些神秘机器如何处理信息的新方法，就是对模型进行过度训练，使其达到意想不到的精通程度。其他研究小组正在使用计算复杂性技术--计算机科学的一个分支，研究不同问题的相对难度--来帮助解释为什么语言模型在逐步解决问题时似乎表现得更好。

资料来源："The Year in Computer Science" by Richard Borge, Published December 19, 2024 - Quanta Magazine

翻译和编辑：银河系搭车客