在得克萨斯州奥斯汀举办的高性能计算用户论坛(HPCUF)上,AMD提前发布了一款Instinct™MI430XGPU,以超过200TFLOPs的原生FP64双精度算力,将下一代英伟达Rubin架构的性能远远甩在身后,达到其6倍以上,有望成为史上双精度浮点性能最强的GPU。
MI430X的技术参数
从核心技术规格来看,MI430X 基于下一代 CDNA 架构(预计为 CDNA 5),采用先进工艺与封装技术,专为大规模科学计算与 AI 驱动科研场景设计。
尤其是432GB HBM4 高带宽内存与19.6TB/s 内存带宽,相较上一代 MI350 系列实现翻倍以上提升,解决了大规模仿真与 AI 训练中的内存瓶颈问题AMD。
该加速器原生支持 FP64、FP8、FP4 全精度计算,单芯片同时具备顶尖双精度算力与低精度 AI 算力,完美适配从气候模拟到万亿参数模型训练的全流程科研需求。
此外,MI430X 的 FP64 性能为原生向量计算能力,而英伟达 Rubin 即便通过 Tensor-Core 模拟算法也仅能达到相近水平,这体现了双方在架构设计理念上的根本差异。
MI430X能解决什么问题?
MI430X的横空出世,精准切中了当下科学研究与AI发展的痛点。在气候科学、材料科学、核工程、流体力学等前沿领域,高精度仿真模拟生成的数据正成为训练下一代AI模型的"黄金原料"。
基于低精度、数值不稳定数据训练的AI模型,会天然继承这些缺陷;而依托精准物理仿真数据训练的模型,能够还原底层科学规律的真实结构。MI430X开创的全新加速器性能层级,为科研团队全面迈向AI驱动科研发现提供了关键基础设施保障,解决了"算力基础设施能否在大规模运算下持续输出可靠、精准计算结果"的业界核心疑问。
与专为大规模AI训推设计的MI455X不同,MI430X完美平衡了AI与传统HPC工作负载的需求差异。
这种平衡并非简单的性能叠加,而是架构层面的深度融合——单芯片同时具备顶尖FP64双精度算力与低精度AI算力,成为新兴"科学智能"生态的核心基石。对于AI超级算力工厂和高性能计算中心而言,数值精度与吞吐能力是核心刚需,而MI430X将带来跨越式的算力能力升级,让科学家能够在同一平台上完成从高精度物理仿真到AI模型训练的全流程工作,大幅提升科研效率。
AMD的领先优势
美国橡树岭国家实验室Discovery超算计划于2028年部署,作为美国能源部"创世计划"的核心项目,将搭载AMDInstinctMI430XGPU与新一代EPYC™霄龙CPU,成为美国首批"AI工厂型"超级计算机之一,助力能源、生物、先进材料、国家安全及高端制造领域实现科研突破。
与此同时,欧洲新一代旗舰超算AliceRecoque同样采用这一架构,由法国国家超算中心GENCI主导、CEA运营部署,定位百亿亿次级算力,HPL基准算力预计突破1艾可浮点,主打高能效比与科研吞吐能力。
这两款标杆级超算的落地,标志着AMD在国家级自主AI与HPC基础设施中的版图持续扩张,更意味着全球超算格局正在发生深刻变革。
长期以来,英伟达在AI加速领域的主导地位无人撼动,但在科学计算的核心阵地——双精度浮点运算上,AMD用MI430X实现了对竞争对手的"降维打击"。
这种打击并非偶然,而是AMD多年来深耕CDNA架构、专注HPC与AI融合的必然结果。随着科学智能时代的到来,这种同时兼顾精度与智能的算力供给模式,将成为超算发展的主流方向。
对于整个行业而言,MI430X的发布是一个重要转折点。它不仅打破了英伟达在高性能计算领域的技术垄断,更重新定义了GPU为下一代高性能计算系统所能提供的性能上限。
热门跟贴