随着AI模型参数规模突破万亿量级,算力需求正在从单芯片堆叠向系统级协同转型,传统分布式训练面临通信开销剧增和算力利用率下降等挑战。为解决这一问题,超节点采用高速互联协议和专用交换芯片,构建高带宽域(HBD),将数十到数百颗GPU芯片逻辑整合为统一编址、低延迟、高带宽的协同计算系统。这一架构在保留GPU物理独立性的同时,带来了类单机的编程与调度体验,显著提升了算力利用效率,为大规模模型训练和推理提供了高性能的算力底座。近日,中兴通讯发布《超节点技术白皮书》,提出以超节点为核心打造标准化“AI工厂”,通过系统级架构创新,突破算力极限与能效瓶颈,为AI基础设施的可持续发展提供新路径。
架构创新,OEX正交无背板互联,
零线缆
在硬件层面,白皮书重点阐述了中兴通讯自研的OEX(Orthogonal Electrical eXchange)正交无背板互联交换架构。OEX(Orthogonal Electrical eXchange)正交无背板互联是中兴通讯在超节点架构中提出的零线缆高速互联方案,核心是计算与交换托盘垂直正交对插、取消传统高速线缆与集中式背板,通过短路径直连实现高密、低损、易运维的算力互联,适配 AI 数据中心大规模 GPU 协同计算需求该架构通过物理设计的根本性创新,具体呈现四大核心亮点:
• 高密集成:突破物理空间极限。采用计算托盘与交换托盘垂直交叉的无线缆互联设计,彻底消除了机柜内部成千上万根高速线缆,极大释放了机柜空间,实现了单位空间算力密度的飞跃。
• 高可靠:保障信号完整与系统稳定。通过正交无背板互联显著降低通信损耗,大幅降低误码率。极短的板间互联路径确保了大规模集群通信的高速与稳定。
• 简化运维:极简架构提升可维护性。无线缆设计从根本上减少了因线缆松动、老化或连接器故障导致的宕机风险。极简的物理架构将系统平均故障修复时间(MTTR)从小时级缩短至分钟级,极大提升了系统的可维护性和运行效率。
• 开放互联:自研芯片多协议兼容。依托自研的“凌云”大容量交换芯片,系统支持TB级互联带宽与百纳秒级时延,并全面兼容国内外主流标准及专业定制化互联协议。
维度
技术细节
性能 / 价值
高密集成
垂直正交排布 + 零线缆释放空间,支持多 GPU 高密度部署
单位空间算力密度显著提升,适配万卡级集群扩展
信号完整性
极短互联路径(相比线缆缩短 90%+)、低损耗材料、阻抗精准控制
大幅降低误码率,保障 224G PAM4 等高速信号稳定传输
可靠性
减少线缆松动、连接器故障等单点失效风险
MTTR 从小时级降至分钟级,提升系统可用性
开放兼容
凌云芯片支持 PCIe 5.0、CCIX、NVLink 等主流协议
兼容英伟达 GB200/GB300 等 AI 服务器,适配定制化互联需求
能效与成本
减少线缆与背板功耗(约 15%-20%),简化物料与组装
降低 TCO,提升系统能效比(PUE)
与传统方案对比
方案
OEX 正交无背板互联
传统线缆 + 背板方案
正交背板方案(如英伟达 Rubin)
互联形态
计算 / 交换托盘垂直直连,零线缆、无集中背板
线缆连接计算板与背板,背板连接交换板
计算板与正交背板垂直对插,无中间线缆
复杂度
极简,无冗余线缆 / 背板
高,线缆达数千至数万根,管理维护复杂
中高,依赖超高层背板 PCB 工艺
信号损耗
极低(路径最短)
高(线缆 + 背板双重损耗)
低(背板路径短,但存在层间损耗)
运维难度
低,模块化插拔,MTTR 分钟级
高,线缆排查 / 更换耗时
中,背板故障需整机停机
算力密度
最高
中高
典型应用
中兴超节点 AI 工厂,适配大规模模型训练 / 推理
传统数据中心,中小规模算力集群
英伟达 Rubin Ultra、华为 Atlas950 等高端算力平台
应用场景与落地进展
- 核心场景:AI 大模型训练(万亿参数级)、超大规模分布式推理、高密度智算中心建设,尤其适配 “AI 工厂” 标准化部署需求
落地情况:2026 年 1 月中兴发布《超节点技术白皮书》正式推出,已纳入其全栈智算平台,适配百卡到万卡平滑扩展,支持统一编址与类单机编程体验。
- 生态适配:兼容国内外主流 AI 芯片与服务器,可与光互联协同,构建 “电 + 光” 混合高速互联网络,满足跨机柜大规模扩展需求
技术挑战与行业趋势
- 核心挑战
超高层 PCB(如 78 层)与高精度工艺(激光钻孔、阻抗控制)要求高,良率与成本控制难度大。
正交接口的信号一致性与热设计需精准优化,适配 224G + 高速信号传输。
模块化兼容性需覆盖多厂商芯片与协议,考验生态整合能力 。
- 行业趋势
正交无背板 / 零线缆成为 AI 算力集群主流方向,英伟达 Rubin Ultra、华为 Atlas950 等均采用类似架构。
高速 PCB 材料(如 M9Q)、正交连接器(如 Crossbow)等供应链加速成熟,支撑技术规模化落地。
资料获取渠道
官方白皮书:中兴通讯《超节点技术白皮书》(2026 年 1 月版),含 OEX 架构示意图、性能测试数据、部署指南。
加客服申请中兴通讯《超节点技术白皮书》(2026 年 1 月版)
阅读更多内容长按二维码识别
▼欢迎“点赞”“分享” 在评论区留下您的看法▼
热门跟贴