公众号记得加星标⭐️,第一时间看推送不会错过。

Scale-up 互连从铜到光的必然演进

随着大模型架构从 Dense 向 MoE 演进,并融合训练与推理一体化范式,系统对互连网络在节点规模、带宽密度、通信时延和运行稳定性等方面提出更高要求。高性能互连已成为制约超大规模 AI 集群效率与扩展能力的关键基础设施。

当前主流 Scale-up 方案依赖机柜内铜缆互连。尽管铜互连在成本与时延上具备优势,但其传输距离受限,迫使系统采用极致高密度、强耦合的“AI Rack”架构,导致制造、布线、供电、散热与运维复杂度随规模急剧上升。当集群扩展至百卡乃至千卡级别时,铜互连的物理覆盖能力已接近极限。因此,从铜到光的演进,成为 Scale-up 迈向更大规模、更高可运维性的必然路径。

阿里云全光 Scale-up 网络架构-UPN512

打开网易新闻 查看精彩图片

阿里云于 2025 年 10 月正式发布 UPN512(Ultra-Performance Network for 512 xPU)全光 Scale-up 架构白皮书,提出基于单层以太网光互连的全新设计,旨在构建“大规模、高性能、高可靠、低成本、易扩展”的 xPU 互联系统。

UPN512 通过光互连直接连接 xPU 与交换机,采用单层 CLOS 拓扑实现 512 颗 xPU 的全互联,并为未来扩展至 1K+ 节点预留架构空间。该方案彻底消除机柜内高速铜缆,显著降低布线复杂度、散热负担、供电需求及运维成本。

UPN 512 关键技术-NPO(Near-Packaged Optics)

NPO(Near-Packaged Optics,近封装光学)是 UPN512 架构的核心使能技术。它将光电引擎部署在靠近主芯片的位置,采用线性直驱(Linear Direct Drive)技术,省去传统依赖先进制程的 DSP 芯片,从而实现:

  • 功耗降低 50%以上

  • 成本下降 30%

  • 端到端时延与铜互连相当

  • 供应链更安全可控

相比 LPO(Linear-drive Pluggable Optics),NPO 提供更高的带宽密度,并降低对主芯片 SerDes 性能的要求,更利于生态发展;相比 CPO(Co-Packaged Optics),NPO 采用标准 LGA 连接器,保持光模块的开放解耦特性,避免主芯片与光引擎绑定,更易被终端用户采纳。

打开网易新闻 查看精彩图片

基于NPO光互联系统示意图

阿里云选择从 3.2T NPO 切入研发,基于 OIF 标准封装,在仅 22.5mm × 35.1mm 的尺寸内实现 3.2Tb/s 传输带宽。通过标准 LGA 连接器,光引擎与主芯片实现物理与电气解耦,延续了开放、繁荣的光模块生态。该模块同时支持硅光(SiPh)与 VCSEL 两种技术路线,可灵活适配不同距离与应用场景。

打开网易新闻 查看精彩图片

阿里云3.2T NPO模块形态图

打开网易新闻 查看精彩图片

基于硅光方案的3.2T NPO内部结构

全球首款 3.2T NPO 模块成功点亮

近日,阿里云宣布全球首款基于 OIF 标准封装的 3.2T NPO 模块成功点亮,标志着全光 Scale-up 迈入工程落地新阶段。

该模块基于两颗 16 通道收发一体硅光芯片,搭配线性直驱 Driver/TIA 芯片,采用成熟的 2D 封装工艺,将光子集成电路(PIC)与电子集成电路(EIC)倒装集成于 mSAP 基板上,具备快速量产潜力。

打开网易新闻 查看精彩图片

3.2T NPO全功能模块(内部芯片布局图)

关键性能指标如下:

  • 发送端:光眼图性能优异,典型 TDECQ 仅为 1.9dB,全面符合 IEEE 802.3bs DR4 标准,可与传统带 DSP的 DR4 光模块无缝互通,支持新旧架构混合部署;

  • 接收端:在 1E-6 误码率下,所有通道灵敏度优于 -5dBm,确保充足链路预算;

  • 功耗:典型功耗约 20W,显著低于同带宽 DSP 方案。

打开网易新闻 查看精彩图片

发送端光眼图

打开网易新闻 查看精彩图片

接收端灵敏度

阿里云首个 NPO 项目落地:国产四芯片交换机

阿里云已将 3.2T NPO 技术率先应用于新一代国产四芯片交换机。该设备单机集成 4 颗 25.6T 国产交换芯片,总交换容量达 102.4T,并可通过升级至 4×102.4T 芯片平滑演进至 409.6T 平台。

创新之处在于:每颗芯片以细粒度端口模式(如256×100G)运行,系统内部将物理端口的多条 lane 拆分并连接到不同交换芯片,从而最大化单芯片 Radix 利用率,提升组网规模与灵活性。对外仍以 400G/800G 等主流端口形态交付,兼容现有 MPO 光纤布线体系。

为实现高密度交叉互联,该交换机采用基于 NPO 的系统级光互连设计:

  • NPO 模块紧邻交换芯片部署,在芯片侧完成电-光转换,大幅缩短电通道、减少信号损耗;

  • 光信号经前部集成的 Shuffle 光交叉模组汇聚后输出至面板;

  • 交换模组与 Shuffle 模组间采用快插式光连接,支持模组级热插拔与独立更换,将故障影响范围收敛至最小单元,显著提升现场运维效率与系统可用性。

目前,该交换机已完成整机上电与核心功能验证,NPO 端口实现稳定链路建立,项目正式进入长期可靠性测试阶段。

打开网易新闻 查看精彩图片

基于NPO的国产四芯片交换机硬件架构图

打开网易新闻 查看精彩图片

基于NPO的交换模组实物图(包含散热器)

打开网易新闻 查看精彩图片

基于NPO的交换模组实物图(不含散热器)

NPO 下一步规划

阿里云基础设施事业部物理网络研发团队正聚焦 NPO 在长期运行下的稳定性与故障率验证——这是决定全光 Scale-up 能否规模化落地的关键。同时,团队正联合多家头部互联网企业,在 ODCC(开放数据中心委员会) 推动 6.4T UPO(Ultra Performance Optics)标准立项,旨在构建下一代高性能、低功耗、开放解耦的光互连生态。相关技术规范预计将于 2026 年发布,敬请期待。

阿里云将持续推动光互连技术创新,加速 AI 基础设施普惠化。

(来源:阿里云基础设施)

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4332期内容,欢迎关注。

加星标⭐️第一时间看推送

打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

求推荐

打开网易新闻 查看精彩图片