根据最新报告,英伟达(NVIDIA)即将推出的最新一代GPU Rubin 与 Rubin Ultra 平台正经历重大的设计与规格调整。这些调整发生在 Rubin 系列预计发布之前,该系列原本计划凭借全新的架构、功能及效率升级,实现远超 Blackwell 平台的 AI 性能飞跃。
有消息称,英伟达的 Rubin 与 Rubin Ultra 平台正面临五大关键挑战:HBM4 内存的速度与容量瓶颈、良率与翘曲(Warpage)问题、多电源设计方案受阻,以及散热顶盖(Heatspreader)的重新设计。
HBM4 速度规格下调
在 HBM4 方面,英伟达的 Rubin 平台原计划配备 288GB HBM4 内存,总带宽最高可达 22TB/s。美光(Micron)此前已宣布量产 12 层堆叠(12-Hi)的 HBM4 内存以支持 Rubin 平台,单堆栈带宽可达 2.8TB/s,8 个 HBM4 堆栈的总带宽理论上可达 22.4TB/s。
然而据称,由于美光和 SK 海力士(SK Hynix)的基础裸片(Base Die)质量未达标,英伟达在实现高速内存与 Rubin 平台的适配方面遭遇困难。这可能导致设计变更,并为生产周期带来潜在延迟。
HBM 堆叠层数削减,但相比标准版仍有显著升级
针对高端的 Rubin Ultra 平台,英伟达最初尝试采用 16 层堆叠(16-Hi)的 HBM4E 内存,容量最高可达 1TB。但由于美光和 SK 海力士在量产计划中遭遇良率问题,该设计正缩减为 12 层堆叠。
Rubin Ultra 平台拥有 16 个 HBM4E 堆栈位(每个 GPU 小芯片配备 8 个)。原本 16 层堆叠下单个堆栈容量为 64GB,缩减至 12 层后,总容量将降至 768GB。尽管相比最初设计减少了 25%,但仍比标准版 Rubin 芯片的容量高出 2.66 倍。
四小芯片设计改为双小芯片
除了 HBM 容量与速度,Rubin Ultra 平台在物理架构上也面临规模缩减。根据最新调整,Rubin Ultra 据称将从每块 GPU 集成 4 个晶粒(Die)的方案改为 2 个晶粒的方案。虽然 Rubin Ultra 仍会提供单芯片和双芯片版本,但每个处理器内部的小芯片(Chiplet)数量预计将减半。
造成这一改动的主要原因是严重的良率与翘曲问题。在采用多芯片封装(MCP)技术的超高密度设计中,这类工程难题并不罕见。Rubin Ultra 将采用台积电的CoWoS-L封装技术制造。虽然这种芯片级的规模削减可能会降低单颗处理器的计算性能与容量,但英伟达预计仍将通过系统集成维持其首次披露时的性能水平。
具体而言,英伟达将通过板级组装来实现目标:采用“2+2”配置将 Rubin Ultra GPU 集成在系统内。这意味着每个 Kyber 服务器节点将容纳四颗 Rubin Ultra GPU。在 GTC 2026 大会上展示的原型机也印证了这一点,其机架内搭载了四颗 Rubin Ultra。Ultra 芯片的外观比最初的矩形设计更趋近正方形,暗示其采用了标准的“2 颗晶粒 + 8 个 HBM 堆栈位”配置。
散热顶盖与功耗方案变更
最后,据悉英伟达正在更新 Rubin GPU 的散热顶盖设计,这直接导致了生产延期。原计划于本季度开始量产,但由于芯片规格变动,散热设计已从双散热顶盖布局改为单散热顶盖布局。
有报道指出,原有的双散热顶盖设计在进入大规模量产阶段时,无法满足严苛的翘曲度要求。根据最新时间线,Rubin Ultra 将于 7 月产出验证样品(QS),8 月产出量产样品,预计 9 月实现批量生产,10 月完成机架级准备。
此外,标准版 Rubin 平台在搭配当前的铟-石墨复合导热界面材料(TIM)时也出现了稳定性问题。因此,针对原规划的 2300W 和 1800W 平台,英伟达将回归使用传统的石墨导热介质。
下一场AI 大战:Rubin Ultra 对决 AMD MI500
在争夺 AI 霸权的竞赛中,英伟达的 Rubin Ultra 与 AMD 的 MI500 将形成直接竞争。这两款产品都将是两家公司首批大规模应用共封装光学(CPO/硅光子技术)的产品。
按照目前的时间线,AMD 的MI500平台预计将于 2027 年下半年推出,采用 2.5D/3D 封装技术,并配备 4 晶粒布局及 12 层 HBM4E 内存。而传闻中规格缩减后的 Rubin Ultra 同样采用 12 层 HBM4E 及 2 晶粒封装,预计在 2027 至 2028 年间上市。
尽管目前流言纷扰,但英伟达的供应链合作伙伴通常具备极快的修复能力。此前 Blackwell 世代也曾经历过设计调整,但最终仍按时量产且性能达标。预计 Rubin 系列的问题将很快得到缓解,助力英伟达再次颠覆 AI 领域,尽管眼下的竞争已日趋白热化。
热门跟贴