英伟达与亚马逊正联手推进新一代存储架构研发,通过创新技术实现 GPU 直接控制 SSD 等存储设备,跳过传统 CPU 调度环节,有望破解当前 AI 算力发展的核心瓶颈。英伟达计划在下一代 Vera Rubin AI 平台,率先导入 “GPU 发起直接存储访问”(GIDS)技术,开启算力架构全新变革。
打开网易新闻 查看精彩图片
当前计算机沿用的冯・诺依曼架构,存在明显的数据传输短板。所有数据都需经过 CPU 中转、DRAM 缓存后,才能输送至 GPU,CPU 有限的线程处理能力,难以匹配 GPU 数万级并行算力,数据搬运效率低下,成为制约 AI 模型训练与推理速度提升的关键难题。
GIDS 技术的核心突破,便是打通 GPU 与存储设备的直接通路。该技术可让 GPU 直接向 SSD、高速闪存下发访问指令,全程绕开 CPU 与 DRAM,省去多层调度流程,大幅降低数据传输延迟,释放 GPU 算力潜力。
为适配这一全新架构,高带宽闪存(HBF)应运而生,有效弥补传统 HBM 容量不足的短板。延世大学宋基焕教授团队测试数据显示,6 颗 HBF 搭配 2 颗 HBM,可将 GPU 存储容量从 192GB 提升至 3120GB,扩容幅度超 16 倍。技术应用上,HBF 更适配 AI 推理场景下固定模型参数存储,高频训练场景依旧依赖 HBM 发挥性能优势。
目前该技术赛道已迎来多方巨头布局。英伟达主导 GIDS 技术标准制定,亚马逊优先在云端算力集群落地应用;微软、AMD 同步推进自研方案,三星发力 Z‑NAND 闪存抢占硬件市场。
业内人士表示,GPU 直连存储技术的落地,将重构 AI 算力底层架构,不仅能提升云端大模型运行效率,也将推动 AI 产业向更高性能、更低延迟方向迭代,成为未来算力竞争的重要突破口。
热门跟贴