国产全CPU超算发布：2 Exaflops算力|cpu|exaflops|内存|处理器|新模型|服务器|超级计算机

公众号记得加星标⭐️，第一时间看推送不会错过。

近日，我国首台持续性能超过2EFlops双精度浮点运算的超级计算机“灵晟”正式发布。

据该系统总设计师，中山大学计算机学院教授、国家超级计算深圳中心主任卢宇彤介绍，“灵晟”系统通过国产高性能CPU、片上高带宽内存与高速互连网络等核心技术创新，在全栈自主可控的基础上，实现了架构、性能、能耗等六大技术突破。

尤为关键的是，它打破了传统超算中心科学计算、工程计算与人工智能计算“分而治之”的格局，通过自研的软硬件平台实现“三算合一”，能统一高效支撑分子动力学、流体仿真与AI大模型训练等大规模并发任务。其全球最大规模的集中式全液冷散热系统，也让这台“国之重器”在能效比上达到国际领先水平。

相关报道指出，这台超级计算机将分两期建设。第一期将采用100台华为鲲鹏服务器，共计12800个核心。第二期，根据已公布的报道，将部署47000个CPU，分布在92个计算机柜中，并配备100万个端口的互连网络、36个网络机柜、67个存储机柜、428个存储节点以及10TB/s的带宽。该超级计算机上线后将拥有650PB的存储容量，但上线时间可能还需要数年。

报道披露，由深圳国家超级计算中心（NSCC-SZ）开发的LineShine超级计算机是一套百亿亿次级系统，由20480个计算节点组成，称为整机。每个节点配备两个基于ARMv9架构的LX2处理器。每个LX2处理器集成了两个计算芯片（共304个核心）和八个封装内HBM内存栈（32GB，总带宽4TB/s）。每个计算芯片包含152个核心和128GB封装外DDR内存，这些内存被组织成四个NUMA域。一个专用的SDMA引擎负责DDR和HBM之间的数据传输。LX2处理器通过SME和SVE单元支持FP64/FP32/FP16/INT8指令集，在FP64/FP32指令集下分别可提供高达60.3/120.6 TFLOPS的运算能力。节点之间通过凌奇高速网络互连，采用双平面多轨胖树拓扑结构。每个节点1.6 Tb/s的带宽。”

根据规划，这个全CPU超级计算机将提供2 Exaflops的计算能力，使其成为世界上最快的超级计算机之一，也是目前速度最快的全CPU架构超级计算机。TOP500榜单上的大多数（如果不是全部）最快超级计算机都使用了GPU加速器，其中包括劳伦斯·利弗莫尔国家实验室的El Capitan，以及配备AMD GPU的HPE Cray超级计算机，后者目前是TOP500榜单上速度最快的计算机，其已验证的计算能力为1.8 Exaflops（理论峰值可达2.8 Exaflops）。

（来源：半导体行业观察综合）

*免责声明：本文由作者原创。文章内容系作者个人观点，半导体行业观察转载仅为了传达一种不同的观点，不代表半导体行业观察对该观点赞同或支持，如果有任何异议，欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4391内容，欢迎关注。

加星标⭐️第一时间看推送