公众号记得加星标⭐️,第一时间看推送不会错过。
近日,我国首台持续性能超过2EFlops双精度浮点运算的超级计算机“灵晟”正式发布。
据该系统总设计师,中山大学计算机学院教授、国家超级计算深圳中心主任卢宇彤介绍,“灵晟”系统通过国产高性能CPU、片上高带宽内存与高速互连网络等核心技术创新,在全栈自主可控的基础上,实现了架构、性能、能耗等六大技术突破。
尤为关键的是,它打破了传统超算中心科学计算、工程计算与人工智能计算“分而治之”的格局,通过自研的软硬件平台实现“三算合一”,能统一高效支撑分子动力学、流体仿真与AI大模型训练等大规模并发任务。其全球最大规模的集中式全液冷散热系统,也让这台“国之重器”在能效比上达到国际领先水平。
相关报道指出,这台超级计算机将分两期建设。第一期将采用100台华为鲲鹏服务器,共计12800个核心。第二期,根据已公布的报道,将部署47000个CPU,分布在92个计算机柜中,并配备100万个端口的互连网络、36个网络机柜、67个存储机柜、428个存储节点以及10TB/s的带宽。该超级计算机上线后将拥有650PB的存储容量,但上线时间可能还需要数年。
报道披露,由深圳国家超级计算中心(NSCC-SZ)开发的LineShine超级计算机是一套百亿亿次级系统,由20480个计算节点组成,称为整机。每个节点配备两个基于ARMv9架构的LX2处理器。每个LX2处理器集成了两个计算芯片(共304个核心)和八个封装内HBM内存栈(32GB,总带宽4TB/s)。每个计算芯片包含152个核心和128GB封装外DDR内存,这些内存被组织成四个NUMA域。一个专用的SDMA引擎负责DDR和HBM之间的数据传输。LX2处理器通过SME和SVE单元支持FP64/FP32/FP16/INT8指令集,在FP64/FP32指令集下分别可提供高达60.3/120.6 TFLOPS的运算能力。节点之间通过凌奇高速网络互连,采用双平面多轨胖树拓扑结构。每个节点1.6 Tb/s的带宽。”
根据规划,这个全CPU超级计算机将提供2 Exaflops的计算能力,使其成为世界上最快的超级计算机之一,也是目前速度最快的全CPU架构超级计算机。TOP500榜单上的大多数(如果不是全部)最快超级计算机都使用了GPU加速器,其中包括劳伦斯·利弗莫尔国家实验室的El Capitan,以及配备AMD GPU的HPE Cray超级计算机,后者目前是TOP500榜单上速度最快的计算机,其已验证的计算能力为1.8 Exaflops(理论峰值可达2.8 Exaflops)。
(来源:半导体行业观察综合)
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4391内容,欢迎关注。
加星标⭐️第一时间看推送
求推荐
热门跟贴