打开网易新闻 查看精彩图片

随着2026年AI基础设施需求的加速增长,Pado和Vessl于今年1月宣布的合作伙伴关系重新引起关注,该合作旨在解决行业最大制约因素之一:电力问题。

两家公司表示,这项合作将Pado的网格感知计算编排技术与Vessl的MLOps平台相结合,使AI工作负载与实时能源条件、定价和可再生能源可用性保持一致,同时保持性能和收入目标。该方法在混合和多云环境中为工作负载编排增加了能源智能层,无需进行重大基础设施改变。

自1月以来,这一举措展现了更广泛的转变:能源正成为AI工作负载调度和扩展的关键变量。

Pado是LG的分拆公司,开发使用实时网格数据、定价信号和基础设施遥测技术来优化计算运行时间和位置的软件。Vessl提供全栈MLOps平台,用于在本地、混合和多云环境中部署和管理AI工作负载。组合解决方案旨在将作业路由到电力更便宜或更充足的时间或位置,可能降低成本、缓解网格压力,并随着部署规模的扩大改善可再生能源利用。

Pado首席执行官Wannie Park表示,目标不是传统的效率改进。"灵活性和节能实际上不是数据中心运营商的首要考虑,"Park告诉数据中心知识。"不使用可用电力的机会成本太高。我们专注的是最大化计算能力,而不是最小化消耗。"

Park补充道:"如果你能更高效地提供相同的性能,那就是灵活性和效率开始结合的地方。"

容量限制依然存在

Omdia企业基础设施高级总监Vladimir Galabov告诉数据中心知识:"我认为这种合作很有趣,从纸面上看他们的产品是有意义的。我担心在实践中,它遗漏了一些方面。"

最大的制约因素是可用计算资源。Galabov指出:"如今大多数GPU集群都有很高的利用率。即使某个地区有可用的能源,也很少有未使用的GPU来利用这一点。"

Park表示利用率因细分市场而异。"我们不针对接近完美效率运行的超大规模企业,"他说。"在中端市场,GPU利用率通常接近30%-40%。我们的目标是在不影响SLA的情况下将其推向60%。"

Park补充说,这种灵活性来自更好的工作负载预测和优先级排序。"AI工作负载中正在出现一种'鸭子曲线',"Park说。"我们可以转移低优先级作业或将它们突发到云中,同时保持高价值工作负载在本地。"

分析师对实际影响看法不一

对于正常运行时间研究所的Andy Lawrence来说,这个概念针对的是真正的问题,但采用可能滞后。

Lawrence告诉数据中心知识:"我的第一直觉是这绝对是一个需要解决的问题。使用分析来建模工作负载、网格稳定性和能源成本是正确的方法,这是一个大数据问题。"

但类似的努力一直难以获得关注。

Lawrence说:"从技术上讲,这样的解决方案可能非常有效。挑战在于业务和IT决策者通常不会优先考虑能源或网格因素。如果我正在运行大型AI训练集群,我不确定我会根据能源定价开始重新安排工作负载。人们专注于完成工作。"

他补充说,即使数据存在,也经常不会改变行为。

尽管如此,如果优化能在后台进行,Lawrence看到了潜力。"如果这在不影响性能或用户的情况下不显眼地工作,它就变得令人信服,"他说。"但证据在于它实际工作得有多好。"

能源弹性与编排

与此同时,运营商也在直接解决电力限制问题。

Galabov说:"能够让数据中心离网运行数小时的电池储能系统管道令人震惊。"

Park将存储和编排视为互补的。"存储、网格交互和编排都协同工作,"他说。"我们基于实时数据在正常运行时间、可持续性和成本之间进行优化。"

主权和地理限制

监管和地缘政治因素进一步限制了灵活性。

Galabov说:"主权AI运动非常强大。许多组织不希望工作负载离开国家或地区。"

Lawrence补充道:"今天你可以限制工作负载位置。但这减少了你实际可以使用的灵活性。"

Park说该平台旨在在这些约束内运行。"这不是关于将一切移动到任何地方,"他说。"这是关于在现有环境中进行优化。"

为什么它仍然重要

电力可用性越来越多地影响AI基础设施的扩展位置。

在关键市场中,新容量的门控因素是电力获取,而不是土地或资本。这种转变迫使运营商重新思考如何使用基础设施。

能源感知编排为历史上一直僵化的系统引入了灵活性。

数据中心知识分析

Pado-Vessl合作伙伴关系突出了一个转折点:能源正成为AI基础设施的调度输入。

但概念与现实之间的差距仍然存在。紧张的GPU供应、不断增长的现场能源弹性以及优先考虑性能的操作优先级限制了运营商今天可以利用的灵活性程度。这种紧张关系定义了机会。

如果容量扩大并且自动化成熟,能源感知编排可能释放有意义的效率收益。如果没有,它可能仍然是一个仍由更直接约束定义的市场中的边缘优化层:GPU获取。

Q&A

Q1:Pado和Vessl的合作能解决什么问题?

A:这项合作主要解决AI基础设施的电力瓶颈问题。通过将Pado的网格感知计算编排技术与Vessl的MLOps平台结合,使AI工作负载与实时能源条件、定价和可再生能源可用性保持一致,在保持性能的同时降低成本、缓解网格压力。

Q2:能源感知AI编排技术在实际应用中面临什么挑战?

A:主要挑战包括GPU资源紧张、高利用率限制了调度灵活性,以及业务决策者通常不优先考虑能源因素。此外,主权AI运动和地缘政治因素限制了工作负载的地理灵活性,运营商更关注完成工作而非能源优化。

Q3:这种能源感知技术适合哪些用户群体?

A:该技术主要针对中端市场用户,这些用户的GPU利用率通常在30%-40%之间,有优化空间。不适合已经接近完美效率运行的超大规模企业。目标是在不影响服务水平协议的情况下将利用率提升至60%。