AMD发布全球最强GPU！性能超英伟达6倍，超过200TFLOPs算力|amd|gpu|hpc|人工智能时代|算力|英伟达

在得克萨斯州奥斯汀举办的高性能计算用户论坛（HPCUF）上，AMD提前发布了一款Instinct™MI430XGPU，以超过200TFLOPs的原生FP64双精度算力，将下一代英伟达Rubin架构的性能远远甩在身后，达到其6倍以上，有望成为史上双精度浮点性能最强的GPU。

MI430X的技术参数

从核心技术规格来看，MI430X 基于下一代 CDNA 架构（预计为 CDNA 5），采用先进工艺与封装技术，专为大规模科学计算与 AI 驱动科研场景设计。

尤其是432GB HBM4 高带宽内存与19.6TB/s 内存带宽，相较上一代 MI350 系列实现翻倍以上提升，解决了大规模仿真与 AI 训练中的内存瓶颈问题AMD。

该加速器原生支持 FP64、FP8、FP4 全精度计算，单芯片同时具备顶尖双精度算力与低精度 AI 算力，完美适配从气候模拟到万亿参数模型训练的全流程科研需求。

此外，MI430X 的 FP64 性能为原生向量计算能力，而英伟达 Rubin 即便通过 Tensor-Core 模拟算法也仅能达到相近水平，这体现了双方在架构设计理念上的根本差异。

MI430X能解决什么问题？

MI430X的横空出世，精准切中了当下科学研究与AI发展的痛点。在气候科学、材料科学、核工程、流体力学等前沿领域，高精度仿真模拟生成的数据正成为训练下一代AI模型的"黄金原料"。

基于低精度、数值不稳定数据训练的AI模型，会天然继承这些缺陷；而依托精准物理仿真数据训练的模型，能够还原底层科学规律的真实结构。MI430X开创的全新加速器性能层级，为科研团队全面迈向AI驱动科研发现提供了关键基础设施保障，解决了"算力基础设施能否在大规模运算下持续输出可靠、精准计算结果"的业界核心疑问。

与专为大规模AI训推设计的MI455X不同，MI430X完美平衡了AI与传统HPC工作负载的需求差异。

这种平衡并非简单的性能叠加，而是架构层面的深度融合——单芯片同时具备顶尖FP64双精度算力与低精度AI算力，成为新兴"科学智能"生态的核心基石。对于AI超级算力工厂和高性能计算中心而言，数值精度与吞吐能力是核心刚需，而MI430X将带来跨越式的算力能力升级，让科学家能够在同一平台上完成从高精度物理仿真到AI模型训练的全流程工作，大幅提升科研效率。