Meta宣布与康宁达成一项60亿美元的多年光纤供应协议,凸显了AI基础设施限制正在从计算能力转向物理网络层面。
根据协议,康宁将为Meta提供光纤、线缆和连接解决方案,"加速美国最先进数据中心的建设,支持Meta的应用、技术和AI发展目标",两家公司在声明中表示。
随着超大规模云服务商竞相构建更大规模的AI集群,微软等公司关于即将到来的"网络墙"警告,正将注意力转向物理网络容量,特别是光纤,这成为AI数据中心增长的限制因素。
目前,AI基础设施争论主要集中在GPU和电力等因素的获取上。但大型AI模型产生的爆炸性东西向流量正将数据中心网络推向物理极限,迫使云服务提供商重新考虑其选择。
Gartner分析师Shriya Mehrotra表示:"虽然GPU、电力和冷却长期以来被认为是数据中心扩展的关键约束,但光纤这个曾经主要被视为商品的要素,现在正承担起自己的战略角色。"
Mehrotra补充说,随着超大规模云服务商锁定长期光纤供应并投资专用连接,容量竞争正在加剧。这反过来收紧了其他企业的可用性,延长了部署时间。
随着AI系统扩展,网络限制日益阻碍性能,使昂贵的GPU利用不足,降低了大型基础设施投资的回报。
TechInsights半导体分析师Manish Rawat指出,光纤现在正成为AI扩展的下一个结构性约束,具有潜在的长期影响。
"光纤是随AI增长非线性扩展的无形依赖,"Rawat说。"AI工作负载产生大量东西向流量,需要数千个GPU之间的紧密同步,这大幅增加了数据中心内部和园区间的光学需求。"
但Greyhound Research首席分析师Sanchit Vir Gogia表示,所谓的网络墙并不是单一瓶颈。
"这是一组重叠的约束,当AI工作负载达到规模时会显现,包括光纤可用性、交换密度、光收发器限制和架构效率低下,"Gogia说。
Gogia补充说,AI规模和政府同步宽带推广的综合压力打破了光纤丰富且便宜的历史假设。
然而,分析师表示,仅仅部署更多光纤还不足以应对挑战。底层网络架构也需要改进。
"除了原始光纤和交换,整体网络架构必须演进,以高效路由、处理和管理AI产生的流量,"Mehrotra说。"现有设计可能不适合大规模AI部署产生的聚合和突发流量模式,需要AI网络结构和优化数据中心互连解决方案等新架构。"
Rawat指出,Meta与康宁的交易并非旨在解决短期光纤短缺,而是为Meta在大规模构建AI基础设施时提供更大确定性和控制力。
"Meta正在锁定有保障的光学容量、AI建设周期中的制造优先级,以及针对其架构定制的光纤设计,同时将供应与地缘政治风险隔离,"Rawat说。"这遵循了超大规模云服务商用于定制AI芯片、电力合同和电网规划的相同垂直整合策略。光纤只是下一层。"
Rawat表示,这种方法正在加速双层网络生态系统的出现,超大规模云服务商运营严格控制的供应链,而企业依赖共享容量,交付时间更长,定制选项更少。
"模式从'购买光纤'转向通过远期协议、标准化和多年规划'确保光纤',"Rawat说。"随着超大规模云服务商吸收剩余容量,云互连定价将保持坚挺。最终,对于寻求弹性和可扩展性的企业来说,网络架构选择将比供应商选择更重要。"
据Gogia说,超大规模云服务商实际上正在从光纤生态系统的租户转变为战略所有者。"曾经在现货市场购买的东西,现在正被提前数年锁定,以确保成本确定性、部署速度和运营控制,因为AI基础设施变得日益资本密集,"Gogia补充说。
Q&A
Q1:为什么Meta要与康宁签署60亿美元的光纤供应协议?
A:Meta签署这项协议是为了确保其AI数据中心建设有足够的光纤供应保障。随着AI规模扩大,对光纤的需求急剧增长,Meta需要锁定长期供应以支持其AI基础设施建设,避免供应短缺影响数据中心部署。
Q2:光纤为什么会成为AI发展的新瓶颈?
A:AI模型产生大量东西向数据流量,需要数千个GPU间紧密同步,这大幅增加了对光纤连接的需求。同时,AI工作负载的突发性流量模式对网络架构提出了新挑战,使光纤从普通商品变成了战略性资源。
Q3:这种光纤供应模式会对其他企业产生什么影响?
A:超大规模云服务商锁定光纤供应后,其他企业获得光纤资源的竞争加剧,可用性收紧,部署时间延长。这正在形成双层网络生态系统,大型云服务商控制优质供应链,而普通企业只能依赖共享容量和更长交付周期。
热门跟贴