在AI科研和量子科研领域，英伟达正扮演什么角色？|ai科研|hpc|英伟达|超级计算机|量子科研|量子计算

生成式AI时代的到来，已经在方方面面影响了我们的生活与工作。然而随着AI应用的日益广泛，能效衡量指标却并未跟上AI发展的步伐。

在最近发布的博客文章中，英伟达就指出这一问题，此外也发布了其在AI、量子计算等领域的多项进展。

AI时代需要新的能效指标

一直以来，业界广泛使用PUE即“能源使用效率”作为数据中心计算效率的衡量标准。简单来说，PUE将计算设施消耗的总能源与其计算基础设施所用能源进行比较。在这一标准的指引下，尤其在云计算时代中，包括冷却、电能转换在内的数据中心计算过程中能源浪费得到有效降低。

然而随着进入生成式AI时代，数据中心的工作负载以及运行系统都已产生很大变化，近日英伟达发布的一篇文章指出PUE这一衡量指标在AI时代已渐显捉襟见肘，并呼吁新的衡量标准，从而进一步提高能源效率。

英伟达认为，由于PUE只衡量数据中心所消耗能源，但并没有衡量数据中心的有用输出。这类似于仅考量了发动机的耗油量，却不考虑汽车到底走了多远。

事实上，重心放在AI的数据中心所参考的主要是MLPerf基准测试，用于科学研究的超级计算中心也往往还采用额外的功衡量标准。

此外由于AI发展如此之快，基准测试也在不断更新，比如上一轮MLPerf中就添加了两种生成式AI模型的测试，而这两种模型5年前甚至尚未问世。但也正因此，MLPerf才能有效反映最新的技术水平。

包括PUE概念提出者在内的许多专家也认为，有必要提出新的能效指标。PUE的提出者克里斯蒂安·贝拉迪（Christian Belady）认为，性能指标是关键，而通过对工作负载细分，可以克服无法直接比较不同工作负载的难点。

Blackwell平台助力实现科学计算突破

另据悉，英伟达于2024年3月发布的Blackwell平台，不仅能力出众，更有出色的能耗效率。相比基于CPU等的传统系统，其可将天气模拟的成本和能耗分别降至其1/200和1/300，数字孪生模拟则可降至1/65和1/58。

在Blackwell平台的加持下一些科学研究已经实现突破。例如美国桑迪亚国家实验室正在构建一个适用于并行编程的LLM智能助手。如果仅靠可高效生成基本串行代码的传统AI，每当遇到HPC（高性能计算）应用的并行计算代码时，就会力不从心。而由于Blackwell架构可将资源密集型应用提速30倍，HPC有了新的可能性，这样就可通过LLM处理并解读海量科学数据，并利用高性能计算更快得到价值性洞察，加速科学发现。

据了解，桑迪亚的研究人员通过采用Blackwell平台，实现了名为检索增强生成（RAG）的AI技术，从而可将信息检索能力与语言生成模型结合，并已取得初步的可喜结果，自主生成了可用于并行计算应用的 Kokkos代码。

英伟达AI助力风暴预测、生成基因、开发新材料等实现突破

除了桑迪亚国家实验室，还有全球的多个实验室在生成式AI的助力下，实现高性能计算的发展突破。

比如天气预报领域通过采用英伟达Earth-2（气候与天气研究软件）中的生成式AI模型CorrDiff, 将传统大气模型的分辨率从25公里降尺度至2公里，并将可合并预报量增加100倍以上，大幅提高预测可信度。

总部位于瑞士的Meteomatics公司、位于美国弗吉尼亚州维也纳的Spire公司都通过与英伟达的合作，借助AI的力量实现更快速、准确的预测。

英伟达AI也助力美国阿贡国家实验室实现了生成基因领域的突破。该实验室的研究人员通过AI生成基因序列，来更好地探究新冠病毒背后的病毒。该研究生成的一项名为GenSLMs的模型所生成的模拟结果，与真实世界的非典病毒变体十分相似。

而超过1.1亿基因组序列的GenSLMs模型，就是在包括阿贡实验室的Polaris系统、美国能源部的Perlmutter以及英伟达的Selene等多台搭载NVIDIA Tensor Core GPU 的超级计算机上训练出来的。

Grace系统为超级计算机提供200 EFLOPS AI 算力

此外，在近日的国际超算大会（ISC）上，英伟达也宣布了其新的AI进展，全球有9台超级计算机在通过其基于Grace Hopper超级芯片来加速科研速度。

图 | 英伟达Grace Hopper超级芯片（来源：资料图）

这9台超级计算机包括：法国原子能和替代能源委员会（CEA）与 Eviden 的 EXA1-HE，波兰的 Helios，瑞士国家超算中心的 Alps，德国尤利希超算中心的JUPITER，美国国家超算应用中心的 DeltaAI，以及由东京大学和筑波大学联合成立的日本先进高性能计算联合中心的 Miyabi。

据介绍，这些系统可提供 200 EFLOPS （即每秒 200 百亿亿次计算）的高能效 AI 处理能力。

量子计算平台CUDA-Q为量子计算中心加速

在此次国际超算大会上，英伟达也官宣了其开源量子计算平台CUDA-Q在助力量子计算方面的最新进展。

对于量子计算机来说，QPU也就是量子处理器，有着大脑般的功能。QPU由于利用的是电子或光子等粒子行为来计算，有着与传统处理器不同的计算方式，或将使一些类型的计算加速。

英伟达CUDA-Q则是一个开源的量子-经典加速超算平台，由于性能出色而成为了大部分部署了QPU的公司之选。

其中，日本的ABCI-Q超级计算机采用的是英伟达Hopper架构，并将增加一颗来自QuEra的QPU。而PSNC近期安装了两颗由ORCA Computing公司制造的光子QPU，且将其连接至由英伟达Hopper加速的全新超级计算分区。

毫无疑问，在AI和量子计算的加持下，英伟达将和合作伙伴迎来越来越多的科技新突破。