今天刷到个技术新闻,我第一反应是:好家伙,显存也要搞"扩容包"了?

据TrendForce报道,英伟达正在推进一项叫GIDS的新技术——全称GPU-Initiated Direct Storage Access,计划从Vera Rubin平台开始引入。简单说,就是让GPU绕过CPU和DRAM,直接读写SSD里的数据。外界普遍认为,这可能是HBF(High Bandwidth Flash)发展的关键推手。

打开网易新闻 查看精彩图片

这事得从AI模型的膨胀说起。现在大模型的参数规模涨得太快,HBM那点容量越来越捉襟见肘。去年就有消息说英伟达联合SK海力士、美光这些存储大厂,想推AI SSD的概念,用定制SSD部分替代HBM当GPU的扩展内存。今年SK海力士还拉上了闪迪,搞了个叫HBF的下一代存储方案,本质上都是同一个思路:给GPU找"外援"。

GIDS和英伟达现有的GDS(GPU Direct Storage)听起来像,但区别挺关键。GDS是CPU先把数据从存储设备读到内存,再传给GPU;GIDS则是GPU直接对存储设备下手,中间不经过CPU和DRAM这一道。翻译成人话:以前是"老板→秘书→文件柜",现在变成"老板直接开文件柜"。

这个技术转向背后有个硬问题——传统数据传输方式成了瓶颈。CPU在线程管理上很强,但GPU的优势是海量并行计算。现在GPU和HBM之间的数据传输已经占了系统总功耗的一半左右,再往上堆HBM,边际效益越来越低。HBF的思路就是把超高带宽的NAND闪存拉过来,给GPU当"备用弹药库"。

对NAND闪存厂商来说,这算是个好消息。如果GIDS成了,SSD在AI存储系统里的地位会明显提升,也能缓解HBM在容量上的压力。但有个前提:NAND的读写速度得够快,才能跟得上GPU的胃口。目前NAND的优势是成本和密度——同样空间能塞下比DRAM多30倍的数据,但延迟比DRAM高得多,写入寿命也有限。所以HBF更适合存那些"一次写入、反复读取"的AI模型权重数据,而不是拿来当通用内存使。

说起来,英伟达也不是唯一想改数据传输架构的。微软和AMD也在摸索类似路线。毕竟当模型参数从千亿往万亿走的时候,存储墙的问题会越来越疼。现在各家都在赌:到底是继续死磕HBM的堆叠技术,还是早点把闪存拉进核心战场。

从玩家视角看这事挺有意思——我们打游戏的时候经常吐槽"显存爆了",现在连AI训练卡也开始面临同样的焦虑。只不过人家爆的是HBM,解决方案是往机柜里塞更多SSD。下次再有人问你"这游戏吃不吃显存",你可以回一句:英伟达也在头疼这个问题,而且他们的答案可能是"加硬盘"。