英伟达要搞"显存外挂"：GPU直连SSD，HBM不够用了？|dram|gpu|ssd|内存|固态硬盘|显存外挂|英伟达

今天刷到个技术新闻，我第一反应是：好家伙，显存也要搞"扩容包"了？

据TrendForce报道，英伟达正在推进一项叫GIDS的新技术——全称GPU-Initiated Direct Storage Access，计划从Vera Rubin平台开始引入。简单说，就是让GPU绕过CPU和DRAM，直接读写SSD里的数据。外界普遍认为，这可能是HBF（High Bandwidth Flash）发展的关键推手。

这事得从AI模型的膨胀说起。现在大模型的参数规模涨得太快，HBM那点容量越来越捉襟见肘。去年就有消息说英伟达联合SK海力士、美光这些存储大厂，想推AI SSD的概念，用定制SSD部分替代HBM当GPU的扩展内存。今年SK海力士还拉上了闪迪，搞了个叫HBF的下一代存储方案，本质上都是同一个思路：给GPU找"外援"。

GIDS和英伟达现有的GDS（GPU Direct Storage）听起来像，但区别挺关键。GDS是CPU先把数据从存储设备读到内存，再传给GPU；GIDS则是GPU直接对存储设备下手，中间不经过CPU和DRAM这一道。翻译成人话：以前是"老板→秘书→文件柜"，现在变成"老板直接开文件柜"。

这个技术转向背后有个硬问题——传统数据传输方式成了瓶颈。CPU在线程管理上很强，但GPU的优势是海量并行计算。现在GPU和HBM之间的数据传输已经占了系统总功耗的一半左右，再往上堆HBM，边际效益越来越低。HBF的思路就是把超高带宽的NAND闪存拉过来，给GPU当"备用弹药库"。

对NAND闪存厂商来说，这算是个好消息。如果GIDS成了，SSD在AI存储系统里的地位会明显提升，也能缓解HBM在容量上的压力。但有个前提：NAND的读写速度得够快，才能跟得上GPU的胃口。目前NAND的优势是成本和密度——同样空间能塞下比DRAM多30倍的数据，但延迟比DRAM高得多，写入寿命也有限。所以HBF更适合存那些"一次写入、反复读取"的AI模型权重数据，而不是拿来当通用内存使。

说起来，英伟达也不是唯一想改数据传输架构的。微软和AMD也在摸索类似路线。毕竟当模型参数从千亿往万亿走的时候，存储墙的问题会越来越疼。现在各家都在赌：到底是继续死磕HBM的堆叠技术，还是早点把闪存拉进核心战场。

从玩家视角看这事挺有意思——我们打游戏的时候经常吐槽"显存爆了"，现在连AI训练卡也开始面临同样的焦虑。只不过人家爆的是HBM，解决方案是往机柜里塞更多SSD。下次再有人问你"这游戏吃不吃显存"，你可以回一句：英伟达也在头疼这个问题，而且他们的答案可能是"加硬盘"。