英伟达：通往混合量子-HPC之路|gpu|hpc|英伟达|量子计算机

5月30日，英伟达加速计算副总裁Ian Buck参加了在德国汉堡举行的国际超算大会(ISC)，这是欧洲最大的高性能计算(HPC)会议。Buck在演讲中说[1]：“很多公司正在用高灵敏仪器将HPC推向边缘，或在混合量子系统上加速模拟。量子计算具有巨大的潜力，在GPU超级计算机上模拟量子计算机对于使我们更接近有价值的量子计算至关重要，我们真的很高兴能站在这项工作的最前沿。”

Ian Buck

今天的超级计算机已经迈出了第一步，其模拟量子计算工作的规模和性能水平是相对较小、容易出错的量子系统所无法达到的。已经有数十家量子机构开始使用英伟达cuQuantum软件开发工具包，在GPU上加速其量子电路模拟。

最近，AWS宣布在其Braket服务中提供了cuQuantum。它还在Braket上演示了cuQuantum如何在量子机器学习工作负载上提供高达900倍的加速[2]。

而且，cuQuantum现在可以在主要的量子软件框架上实现加速计算，包括谷歌的qsim、IBM的Qiskit Aer、Xanadu的PennyLane和Classiq的量子算法设计平台。这意味着这些框架的用户可以访问GPU加速，而无需任何额外的编码。

5月30日，Menten AI宣布开始使用cuQuantum来支持其量子工作[3]。这家湾区药物发现初创公司将使用cuQuantum的张量网络库来模拟蛋白质的相互作用并优化新药物分子，目的是利用量子计算的潜力来加速药物设计——这一领域和化学本身一样，被认为是最早受益于量子加速的领域之一。具体而言，Menten AI正在开发一套量子计算算法，包括量子机器学习，以突破治疗设计中的计算要求问题。

Menten AI的首席科学家Alexey Galda说：“虽然能够运行这些算法的量子计算硬件仍在开发之中，但像英伟达cuQuantum这样的经典计算工具对于推动量子算法的发展至关重要。”

cuQuantum

洛斯阿拉莫斯国家实验室（LANL）的新超级计算机Venado将提供10百亿亿flops的AI性能，以推进材料科学和可再生能源等领域的工作。LANL研究人员的目标是在他们的计算多物理场应用中加速30倍，系统中运用了英伟达GPU、CPU和DPU。具体来说，Venado使用NVIDIA Grace Hopper Superchips来运行工作负载，速度比以前的GPU快3倍；还集成了NVIDIA Grace CPU超级芯片，可在长尾未加速的应用程序上提供两倍于传统CPU的每瓦性能[1]。

超级计算机Venado

LANL系统是全球众多采用英伟达BlueField DPU以卸载和加速主机CPU的通信和存储任务系统之一。德克萨斯州高级计算中心正在将BlueField-2 DPU添加到Lonestar6上的英伟达Quantum InfiniBand网络中，它将成为云原生超级计算的开发平台，托管具有裸机性能的多个用户和应用程序，同时安全地隔离工作负载。

在欧洲，英伟达和SiPearl正在合作扩展在Arm上构建百亿亿次级计算的开发人员生态系统。这项工作将帮助该地区的用户将应用程序移植到使用SiPearl的Rhea和未来基于Arm的CPU以及英伟达加速计算和网络技术的系统上。

日本计算科学中心正在英伟达H100 Tensor Core GPU和x86 CPU上集成英伟达Quantum-2 InfiniBand平台。新的超级计算机将解决气候学、天体物理学、大数据、人工智能等领域的工作。

HPC用户之所以采用英伟达技术，是因为它们为已建立的超级计算工作负载（模拟、机器学习、实时边缘处理）以及量子模拟和数字孪生等新兴工作负载提供了最高的应用性能。但英伟达表示，这一技术仍有进步空间：

为了给量子处理器（QPU）编程，研究人员被迫使用相当于低级汇编代码的量子代码，这对于非量子计算专家的科学家来说是不可能的；此外，开发人员缺乏一个统一的编程模型和编译器工具链，让他们在任何QPU上运行工作。

这种情况需要改变，而且会改变。随着量子系统的发展，下一个大的飞跃是转向混合系统：量子和经典计算机一起工作。研究人员对系统级的QPU有一个共同的愿景，即作为一类新的和强大的加速器。因此，未来最大的工作之一是将经典和量子系统连接成混合量子计算机。

这项工作有两个主要部分：

首先，我们需要在GPU和QPU之间建立快速、低延迟的连接。这将让混合系统使用GPU来完成它们擅长的经典工作，如电路优化、校准和纠错。GPU可以加快这些步骤的执行时间，并削减经典和量子计算机之间的通信延迟，这是今天混合量子工作的主要瓶颈。

其次，该行业需要一个统一的编程模型，高效且易于使用。英伟达在HPC和AI方面的经验告诉自己和用户，可靠的软件堆栈具有很高的价值。

为了有效地找到量子计算机可以加速他们的工作，科学家们需要将他们的HPC应用程序的一部分首先移植到模拟QPU上，然后再移植到真正的QPU上。这需要一个编译器，使他们能够以高性能水平和熟悉的方式工作。

有了GPU加速的模拟工具、编程模型及编译器工具链的结合，HPC研究人员将有能力开始构建未来的混合量子数据中心。

尽管量子计算可能听起来像科幻小说，是几十年后的未来。事实上，研究人员每年都在建造更多、更大的量子系统。英伟达公司全面参与了这项工作，也邀请更多业界伙伴加入这一进程，共同构建明天的混合量子系统。

链接：