在2026年GTC大会上,日立万塔拉和Nutanix宣布支持英伟达的新型GPU和软件,与其他存储系统厂商一样,而IBM则将Watsonx和其他产品与英伟达的产品进行了更紧密的集成。希捷展示了由SSD和磁盘驱动器组成的双层混合外部KV缓存,正如去年所做的那样。
可以将所有存储公司想象成围绕英伟达这个巨大太阳运行的行星,每家公司都试图尽可能接近英伟达,以便在向客户销售产品时获得优势。
日立万塔拉
日立万塔拉的Hitachi iQ是一个硬件和软件产品组合,旨在帮助企业部署和运营AI基础设施,构建在虚拟存储平台One(VSP One)存储系统之上。它将加速计算、网络和存储集成到一个验证的基础设施堆栈中,并支持日立的HMAX软件套件,将AI引入社会基础设施。Hitachi iQ现在支持:
英伟达Blackwell GPU(风冷)
Blackwell Ultra GPU(风冷和液冷)
基于英伟达MGX的系统,最多配备四个RTX PRO 6000 Blackwell服务器版GPU
Hitachi iQ还计划支持新发布的RTX PRO 4500 Blackwell服务器版GPU
日立万塔拉将支持英伟达的STX参考架构,开发运行在Vera Rubin GPU、BlueField-4 DPU和Spectrum-X网络以及其AI软件上的AI原生存储系统。
Hitachi iQ Studio软件基于英伟达的AI数据平台参考设计构建,包括扩展的AI蓝图和多智能体协调功能。新的蓝图引入了定义的智能体角色,包括监督者和工作者模型。工作者智能体执行任务,而监督者智能体协调多智能体工作流程并根据结果进行调整。
Hitachi iQ Studio还扩展了对Nemotron模型的支持,这些大语言模型旨在为先进的工具使用智能体AI系统提供动力,并引入了时间机器功能,使AI系统能够导航历史数据集。这种时间感知智能增强了可解释性,并支持依赖长期数据模式来做出决策的客户。
现在Hitachi iQ Studio和Hammerspace之间有了更紧密的集成,以简化智能体驱动工作流程的数据访问。通过这种扩展功能,由Hammerspace管理的数据可以使用模型上下文协议(MCP)在Hitachi iQ Studio内直接访问,MCP是一个开放标准,允许AI系统安全地连接到外部数据源。
这使客户能够在Hitachi iQ Studio中构建AI智能体,这些智能体可以使用并帮助管理他们的Hammerspace数据环境,将自动化和洞察力直接扩展到分布式数据,而无需重新定位。数据在VSP One内保持受管理和保护。
IBM
IBM提供了关于其与英伟达合作的四个要点:
加速结构化数据分析。
英伟达cuDF和IBM Watsonx.data的SQL引擎Presto的开源集成将能够在大型数据集上实现更快的查询执行。为了验证这一点,IBM和英伟达将GPU加速的watsonx.data应用于雀巢的订单到现金数据集市。Watsonx.data将查询运行时间从15分钟减少到3分钟——实现了83%的成本节约和整体30倍的价格性能提升。
释放企业数据的全部价值。
公司正在使用IBM的Docling和英伟达Nemotron开放模型来解决非结构化数据问题——这一组合旨在在企业规模上提供智能文档提取。
优化基础设施。
英伟达正在为其GPU原生高级分析引擎使用10PB的Storage Scale System 6000。对于数字主权是一个因素的受监管行业,IBM和英伟达正在探索IBM Sovereign Core与英伟达基础设施和Nemotron模型的集成。
推进企业AI堆栈。
IBM正在IBM云上提供Blackwell Ultra GPU,用于大规模训练、高吞吐量推理和AI推理。这项技术还将通过Red Hat AI Factory与英伟达和VPC服务器集成。此外,IBM咨询计划通过IBM咨询优势将Red Hat AI Factory与英伟达带给客户。
Nutanix
Nutanix宣布了Nutanix智能体AI,这是一个全栈软件解决方案,旨在帮助客户加速采用智能体AI。
Nutanix产品管理执行副总裁Thomas Cornely在声明中说:"Nutanix智能体AI扩展了我们的AHV虚拟化程序、Flow虚拟网络、Nutanix Kubernetes平台和Nutanix企业AI,为企业AI工厂提供云操作模型,使基础设施和平台团队能够简单地构建、操作和管理AI工厂,同时为智能体AI开发人员提供他们需要的性能和丰富的模型和AI平台服务集合。"
Nutanix智能体AI在智能体构建器层与英伟达AI企业版集成,并为支持的配置编排英伟达认证的AI工厂生态系统。它使客户能够构建、运行和保护智能体AI应用程序,配备一套基础设施编排和安全软件,以及面向数据科学家和智能体AI开发人员的AI平台服务(PaaS)和模型即服务(MaaS)。
更详细地说:
Nutanix企业AI(NAI)v2.6包括一个AI网关服务,用于对云托管和私有大语言模型进行统一策略控制。对模型上下文协议(MCP)服务器和微调的新支持扩展了其现有的MaaS功能,使智能体能够安全地连接到企业工具和数据源。NAI还支持Nemotron系列开源AI模型、数据集和训练工具。
Nutanix已经扩展了其符合CNCF标准的Nutanix Kubernetes平台(NKP),配备了一套预构建的开源AI开发工具,包括笔记本、向量数据库、MLOps工作流引擎和智能体框架。由于其英伟达AI企业版集成,开发人员可以即时部署英伟达NIM,包括Nemotron。
AHV虚拟化程序已得到增强,可以自动优化在GPU密集服务器上的物理资源到虚拟机的分配,并帮助最大化性能。Flow虚拟网络软件已得到增强,可以将网络数据平面卸载到BlueField DPU,减少主机CPU和内存消耗。
Nutanix统一存储为数千个GPU客户端提供线性可扩展的读/写性能。Nutanix提供了一个可扩展、低延迟的数据结构,通过为KV缓存卸载提供高容量层和支持基于RDMA的S3和基于RDMA的NFS来最大化GPU效率。
Nutanix智能体AI软件包含已普遍可用或目前处于早期访问阶段且预计很快可用的产品。
希捷展示了其磁盘JBOD(磁盘盒)支持超微KV缓存扩展SSD JBOF(闪存盒),并提到了其NVMe访问磁盘驱动器的想法,但不像在2025年GTC上那样突出。
KV缓存扩展演示包括:
英伟达GB10 GPU集群计算节点,配备用于大语言模型部署的Dynamo KV块管理器。
两个BlueField-4(BF-4)DPU,通过以太网连接到GPU服务器,控制NVMe-oF和缓存,配备Linux集群卷管理和SPDK缓存
超微NVMe-oF BOF作为高速网络NVMe SSD缓存层,将即时上下文保持在计算附近,通过PCIe连接到BF-4。24个32TB NVMe SSD提供720TB容量
SAS连接的希捷Exos 4U74硬盘JBOD,由74个32TB SATA Exos组成混合SSD/HDD NVMe-oF目标,提供2.4PB容量。
超微的EMEA总裁兼董事总经理、技术和AI高级副总裁Vik Malyala说:"结合超微的JBOF闪存层和希捷的硬盘层可以大幅降低推理成本,同时提供高性能。"
希捷和超微表示,智能AI堆栈将短期内存(闪存)与长期内存(磁盘)分离,并将每个层用于其最擅长的工作:
实时访问层(GPU HBM内存、CPU DRAM、本地和网络NVMe SSD):处理"现在"的上下文——活跃Token、热嵌入和频繁访问的数据
容量层(由硬盘构建):保存"长期"上下文——大型数据集、长期历史和扩展智能体内存
所有层都有自动数据放置,DPU协调跨层的数据移动和缓存,这样使用成本更低的闪存,因为"硬盘为长期内存提供了显著更低的每GB成本。"
图表显示测试结果表明,在首Token时间方面,混合SSD/HDD缓存与本地NVMe SSD之间几乎没有差异。
希捷表示其系统可以扩展并可以容纳更新的组件。其幻灯片显示了从今天的BlueField-3跳转到未来某个时候的BlueField-4,然后从SATA跳转到未来的NVMe连接磁盘驱动器。这与2025年GTC上的类似演示形成对比,当时它使用了原型NVMe磁盘驱动器。
目前还不需要它们,尽管希捷随后指出NVMe硬盘消除了对HBA、协议桥接器和额外SAS基础设施的需求,并提供了简化AI存储的统一NVMe架构。
这是一个演示,没有实际的希捷/超微组合JBOF/JBOD/DPU产品。如果KV缓存扩展变得普遍,如果NAND价格继续变得更加昂贵和稀缺,那么希捷也许有办法将HDD销售到KV缓存扩展市场。值得赞扬的尝试。
Q&A
Q1:什么是KV缓存扩展技术?它有什么作用?
A:KV缓存扩展是一种将短期内存(闪存)与长期内存(硬盘)分离的技术。实时访问层处理活跃Token和频繁访问的数据,而容量层保存大型数据集和长期历史。这种技术可以大幅降低推理成本同时保持高性能,希捷和超微的测试显示混合SSD/HDD缓存与本地NVMe SSD在首Token时间方面几乎没有差异。
Q2:日立万塔拉的Hitachi iQ支持哪些英伟达GPU?
A:Hitachi iQ现在支持英伟达Blackwell GPU(风冷)、Blackwell Ultra GPU(风冷和液冷)、基于英伟达MGX的系统(最多配备四个RTX PRO 6000 Blackwell服务器版GPU),并且计划支持新发布的RTX PRO 4500 Blackwell服务器版GPU。该系统还将支持英伟达的STX参考架构。
Q3:IBM与英伟达的合作在数据分析方面有什么突破?
A:IBM通过英伟达cuDF和IBM Watsonx.data的SQL引擎Presto的开源集成实现了显著突破。在雀巢的订单到现金数据集市验证中,GPU加速的watsonx.data将查询运行时间从15分钟减少到3分钟,实现了83%的成本节约和整体30倍的价格性能提升。
热门跟贴