公众号记得加星标⭐️,第一时间看推送不会错过。

英伟达或许正推动其客户在其数据中心中采用 800 伏特电源,但施耐德电气的高管们预计,近期内仅有不超过 10% 的新人工智能节点会转而采用这种高电压技术。

公司已经在装配140千瓦的架子,越来越多地装配200千瓦的。但英伟达的“Kyber”架构,设想了传说中的1兆瓦架子,是以800伏特为基础的。

在纽约布法罗的数据中心活动中,施耐德电气的云和服务提供商技术和解决方案总监Rob Bunger解释说,传统的机架内部电源是48伏特,这是“触摸安全”的。但随着机架达到400千瓦,机械/电气问题开始出现,Bunge继续说道。这包括来自馈电和转换器的机架拥堵以及低电压下母线杆的机架功率能力。

正如Bunger解释的那样,一个150千瓦的架子运行72个GPU需要8根“鞭子”或电源线。一个1000千瓦的运行144个GPU的架子需要32根鞭子——而且它们会更大。“这不切实际,完全没有意义,” Bunger说。

因此,Bunger继续说道:“你要做的两件事是,将那些转换器——将交流转换为直流或步进直流电压的整流器——移出机架。你整合它们,并提高电压,以获得每根导线的更多功率。”

他说,要达到800伏特,首先要通过机架内部的边车来实现,但这本身就会占用机架空间。

打开网易新闻 查看精彩图片

“随着数据中心规模越来越大,使用大量的边车会变得不太实际,因此会出现集中式解决方案,允许进行更大规模的电力转换以支持多条路径,我们称之为集中式直流配电。”

但他说道:“现在你必须考虑,‘好吧,转换可能发生在白色空间之外,我必须将 800 伏电压输送到 IT 机架,’这样才能实现配电、保护、灵敏度以及所有这些方面。”

他预测,到今年年底将实现小规模部署,到 2029 年将实现“更集中式”的配电解决方案。最初的边车式解决方案将“能够提供 600 千瓦到 1 兆瓦的电力,所以你可以想象,这将能够为一到三个非常高端的 AI 机架供电。”

对于集中式解决方案,“我们将推出能够将交流电转换为 800 伏的转换器,这些转换器的功率大小约为 2 至 5 兆瓦,大致如此,这就是我们看到的中间产品。”

打开网易新闻 查看精彩图片

他补充道:“你看,这里用的是直流UPS,所以会配备储能电池。从直流输出不间断电源的角度来看,它就是直流UPS。侧挂式设备也可以配置储能装置。”

但Bunger表示,尽管英伟达正在大力推进800伏电压技术,但这并不意味着需要对现有设施进行大规模改造。“我们认为,到2030年,可能只有10%的新型AI节点需要800伏直流电。”

即使是全新的数据中心也不会完全采用 800 伏电压。“我们可能会在数据中心内看到部分区域使用 800 伏电压,” Bunger说,同时还会混合使用中低压电压。

不过,他表示,随着密度的增加,这仍然会对数据中心的整体设计产生影响。“设施设备与IT设备的比例肯定会发生变化。”

不出所料,施耐德表示,对电力基础设施进行整体改造是明智之举——或者换句话说,选择单一供应商才是明智之举。“你必须从配电盘、母线波、断路器等各个方面考虑整体解决方案。”

“因此,800伏电压部署的第一阶段将是一个经过高度工程化设计的完整系统,以确保其高度可靠性。随着整个市场在标准和更多选择方面的成熟,我们将开始看到产品之间更高的互操作性。”

Bunger补充说,与传统的云工作负载相比,人工智能工作负载的性质使情况更加复杂。

传统上,“该设施的全部目的就是保护 IT 负载,你知道,就是要保证最高的安全性和最高的可用性。”

相比之下,人工智能的工作负载并非静态的。“尤其是在人工智能训练方面。它们的负载呈脉冲式变化,因此你必须考虑这种脉冲式负载以及非常非常大的负载对电网的影响。”

此时,故障穿越能力就成了一个问题。“因此,数据中心不仅要像以往一样保护IT负载,现在还要同时保护电网。”

施耐德电气首席营销官凯文·布朗补充说,800伏电压并没有什么特别神奇之处,“行业转向800伏直流电的原因是电动汽车。因为有现成的供应链可以供应连接器,而且人们也了解它的工作原理等等。”

如果说改变电源架构还不足以让人工智能和高性能计算工程师们忙得不可开交,那么施耐德电气还指出,随着这些耗电大户机架的普及,转向液冷散热将有助于人工智能数据中心释放更多代币。此外,该公司还驳斥了人工智能数据中心正在引发水资源危机的说法。

施耐德电气冷却技术和产品开发主管 Tuan Hoang 根据公司的参考设计,概述了德克萨斯州和巴黎的假定人工智能数据中心的用水量案例研究,比较了蒸发冷却和液冷系统的影响。

该研究比较了在德克萨斯州和巴黎运行 100 兆瓦数据中心的影响。

他表示,基于这些数据,在达拉斯建造一座100兆瓦的空冷/蒸发式塔式电站,其PUE值为1.148,耗水量相当于161个奥运标准游泳池,同时可产生1.99×10⁸个代币。如果将电站移至气候更为温和的巴黎,PUE值则降至1.11,耗水量相同,但代币产量可达2.78×10⁸个。

以下是达拉斯案例的对比数据:

打开网易新闻 查看精彩图片

以下是巴黎方案的分析:

打开网易新闻 查看精彩图片

最后,这里有一个汇总表来比较这两者:

打开网易新闻 查看精彩图片

德克萨斯州的一座数据中心采用液体冷却技术,并配备了英伟达的 Vera-Rubin AI 系统,其 PUE 值为 1.04,需消耗 79 个水池的用水量,并产生 2.52 × 10^11 个代币。与之对应的巴黎数据中心则拥有相同的 PUE 值(1.04)、需消耗 20 个水池的用水量,并能产生 2.91 × 10^11 代币。

作为比较,一个奥运游泳池相当于2500立方米的水,而一个典型的达拉斯家庭每年消耗416立方米水,而一个巴黎家庭每年消耗110立方米。

当然,真正的挑战在于获得许可,以便在空间紧凑、电力资源有限的“光之城”与电力和土地资源充裕的德克萨斯之间,搭建一座符合人工智能规模的数据中心。

但黄说,这项研究意义重大,因为耗水量是社区反对数据中心的原因之一。他说,数据表明“耗水量是一种选择,而不是一种要求。”

他说,使用水来更有效地提取热量是有成本的。“但位置决定也会改变消耗的水量。想象一下,将这种情况推到极端,去北方或更凉爽的环境,或者去中东或沙漠的环境。”

施耐德 CMO 布朗补充道,该行业必须更加努力地阐明液体冷却“并不意味着用水”。实际上,用水量减少是由于采用了蒸发式冷却技术,而这正是为了提升能源利用效率。但人工智能数据中心实际上等同于采用液体冷却技术。

通过采用液体冷却,布朗说,“因为温度变化,你有独特的机会通过建筑变化,我们的用水量相对来说会下降。你消耗的千瓦和发电量将变得更加高效。”

有关人工智能数据中心因采用液体冷却方式而消耗大量水资源的传言是“不实的”——你完全能够避免这种情况,同时仍能拥有高效的数据中心

尽管当地社区很可能对一座占地超过 200 英亩的 AI 设施被建在他们附近持有多项其他反对意见。

(来源:编译自nextplatform,谢谢 )

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4423内容,欢迎关注。

加星标⭐️第一时间看推送

求推荐