打开网易新闻 查看精彩图片

IBM正在引领量子计算的发展,但我们的愿景涵盖了计算的整体未来。实际上,量子计算将成为一个新范式的组成部分,这个范式结合了我们现有的所有计算工具,以解决超越当今任何可能性的问题。

这一直是我们的愿景,来自橡树岭国家实验室、AMD、RIKEN、Algorithmiq以及更广泛的量子社区合作伙伴的越来越多的成果正在将其变为现实。这些进展展示了最先进的GPU与量子处理单元(QPU)协作如何加速工作流程并提高量子计算的整体保真度。这些混合方法不依赖于任何单一架构,而是展示了紧密集成的CPU、GPU和QPU如何共同释放超越任何单一架构所能实现的性能和准确性。

这是一个全新计算范式的体现,需要新的算法和解决问题的新方法。这个范式就是量子中心超级计算。

不同处理器架构的独特优势

中央处理单元(CPU)、图形处理单元(GPU)和量子处理单元(QPU)都具有独特的底层架构,为问题解决带来各自的优势。CPU是当今计算机的主力,能够在一个或多个称为线程的序列中对数据执行指令,使我们能够执行各种数学运算或调度和编排复杂的工作负载。

与此同时,GPU是能够使用更多线程(数千甚至数百万个)并行执行许多更简单操作的计算机处理器。GPU优化用于执行涉及张量的快速计算,张量本质上是多维数据结构,其中每个条目都有特定的位置。一维张量称为向量,具有列中的数字,二维张量或矩阵可以用电子表格表示,三维张量可以是包含许多电子表格的文件,四维张量是许多文件,每个文件都有许多电子表格,依此类推。

QPU具有不同的底层架构,将信息存储在量子系统的状态中。QPU天生能够访问CPU和GPU无法执行的数学运算,它们使用量子电路运行这些运算。在实践中,每个量子电路都可以表示为使用必须遵循一组规则的矩阵的数学运算序列。

这些操作可以使用QPU有效执行,但使用经典GPU运行需要指数级更多的空间。50量子比特电路上的操作可能由具有多达2^50个条目的矩阵表示以准确模拟,这远远超出了任何GPU的能力。

因此,QPU在逻辑上与CPU和GPU协同工作。QPU可以处理量子电路,否则需要比GPU能够处理的更大的张量。同时,CPU和GPU可以在较小规模上接管问题的某些部分,这些部分需要许多简单张量的并行操作或传统的处理和编排任务。

样本量子对角化技术的突破

在过去几年中,出现了依赖张量和电路协作解决最具挑战性问题的新算法。其中最令人兴奋的是基于样本的量子对角化(SQD)技术,它很快就能提高大型化学或材料科学模拟的准确性。

来自AMD、橡树岭国家实验室合作伙伴的新工作,以及与RIKEN的后续工作,在IBM QPU和利用世界上最快的一些GPU的超级计算集群上实现了SQD,展示了我们对计算未来愿景的初步展望。

准确模拟化学过程极具挑战性。我们可以使用称为哈密顿量的方程来描述系统的整体行为,但实际上从哈密顿量中提取信息——比如分子不同可能配置之间的能量差异——需要极其庞大的张量,这意味着即使是世界上最好的超级计算机也只能进行近似计算。SQD旨在借助量子处理产生更好的近似值。

SQD首先将哈密顿量编码到量子电路中并在量子计算机上运行,产生要研究的配置候选列表。它将这些信息传递给经典计算机,经典计算机使用这些配置创建描述系统的更简单张量,然后对其进行对角化——本质上是重新组织张量,以便我们可以有意义地提取有关这些配置的物理信息。我们将这些信息传递回量子计算机,迭代执行此过程,直到找到最低能量配置及其相关能量。

SQD在电路和张量表示之间传递信息的过程使其非常适合在GPU和QPU上实现——最近,我们的合作伙伴已经开始执行这些实现。

在一篇论文中,IBM、橡树岭国家实验室和AMD的研究人员提出了在IBM QPU上实现SQD的过程,在Frontier超级计算机上利用AMD和NVIDIA GPU,借助OpenMP API进行共享内存多处理编程。他们测量了在Frontier上运行SQD相比CPU基础情况的约100倍加速,在整合最新的AMD MI300X和MI355X GPU或NVIDIA H100和GB200 GPU时进一步获得1.8倍到3倍的加速。

随着这些新工作流的出现,我们可以开始推动其性能并提高其灵活性。基于橡树岭的工作,我们还与RIKEN合作,借助Thrust库和使用NVIDIA GH200 GPU的Miyabi超级集群优化SQD工作流的GPU对角化。结果是在OpenMP基础上又提高了20%的性能,具有探索更高级GPU实现的更大灵活性。

张量增强量子计算精度

除了混合算法之外,我们甚至可以结合张量,很快还有GPU,从量子处理器中提取更准确的结果。新的错误缓解技术在噪声量子处理器上运行电路,然后使用基于张量的模型来消除噪声的影响。

在上周发布的一篇论文中,来自初创公司Algorithmiq、都柏林三一学院和IBM的研究人员探索了研究量子多体系统中混沌的算法。这项工作采用了一类新的量子电路,称为双幺正电路——在空间和时间上都具有特殊的数学限制——来探索原本非常具有挑战性的系统。这类电路允许研究人员模拟混沌但也有精确可验证解决方案的系统,使它们对当今量子计算机的基准测试特别有用。

至关重要的是,这项工作使用了Algorithmiq开发的新错误缓解技术——现在作为Qiskit函数提供。该技术使用张量创建噪声模型,然后反转模型以从量子电路的输出中去除噪声。这项工作使我们能够为经典计算alone无法验证的更大问题提取有意义的结果,使用量子电路运行计算并使用张量进行清理。

鉴于张量和电路的结合使用,在近期量子工作流中缓解错误是一个使用GPU辅助QPU进行探索的成熟领域。今年,我们期待各种基于张量的错误缓解技术帮助用户运行准确的量子计算——在GPU的帮助下进一步加速。

同时,巴斯克量子、NIST和IBM研究人员展示了在IBM量子处理器上与经典张量网络协同工作的时间晶体。时间晶体是接收周期性能量输入的系统,以稳定的周期性模式振荡,抵抗扰动它的尝试。

研究人员研究时间晶体以推进材料科学和量子信息研究,在这种情况下,在144个量子比特上创建了二维时间晶体。这是迄今为止展示的最大和最复杂的之一。团队根据最佳可用张量网络方法测试量子结果,并使用这些方法帮助改进量子执行。鉴于张量方法的使用,这是未来可以通过GPU扩展的工作类型。

量子中心超级计算的未来

这是计算真正未来的一瞥:不仅仅是量子计算,或仅仅是经典计算,而是量子中心超级计算。该领域正在爆发性地研究结合张量和电路——因此GPU和QPU——来执行挑战即使是最好的超级计算机的任务。

这只是开始。随着我们在路线图上的进展,对IBM量子处理器的改进将使我们能够更快地提取更准确的答案。我们继续向Qiskit(开源软件开发套件)添加新功能,以便开发人员可以编排包含基于云或本地量子、经典和GPU处理的异构工作流。到本十年末,我们将展示一个能够运行容错量子计算的系统,可能在系统内部结合经典计算和GPU来辅助错误校正,在外部利用可用的最佳资源来解决最困难的问题。

参与这一未来的唯一途径就是开始行动。用户应该探索如何将他们的困难问题映射到电路和张量,并开始在量子计算机和GPU上运行它们。在这个新兴时代的获胜者将是那些能够驾驭量子中心超级计算真正力量的人。

Q&A

Q1:什么是量子中心超级计算?

A:量子中心超级计算是一个全新的计算范式,它结合了CPU、GPU和量子处理单元(QPU)的优势,通过紧密集成这些不同的处理器架构,能够解决超越当今任何单一架构所能处理的复杂问题,特别是在化学模拟和材料科学等领域。

Q2:样本量子对角化技术如何工作?

A:样本量子对角化(SQD)技术首先将哈密顿量编码到量子电路中并在量子计算机上运行,产生要研究的配置候选列表,然后传递给经典计算机创建更简单的张量并进行对角化,这个过程迭代进行直到找到最低能量配置,能够显著提高化学和材料科学模拟的准确性。

Q3:GPU和量子处理器如何协同工作?

A:GPU和量子处理器通过处理不同类型的计算任务实现协同。量子处理器擅长处理需要指数级空间的量子电路运算,而GPU则负责并行处理较小规模的张量运算和传统处理任务。最新研究显示,这种协同可以实现100倍的性能提升,并在错误缓解等方面发挥重要作用。