去年AMD、博通(Broadcom)、思科(Cisco)、谷歌(Google)、Hewlett Packard Enterprise (HPE)、英特尔(Intel)、Meta和微软(Microsoft)宣布成立Ultra Accelerator Link (UALink)联盟,共同制定一项新的行业标准,致力于推进数据中心中扩展AI系统的高速和低延迟通信。随后苹果、阿里云、以及Synopsys加入,被选为UALink联盟董事会新成员。
UALink联盟宣布,正式发布UALink 1.0规范,意味着小组成员现在可以对支持新技术的芯片进行流片。其允许在一个计算集群(Pod)内,让接入的GPU等加速器附带的内存之间实现直接加载和存储,提升共同完成大规模计算任务的效率。
UALink 1.0规范支持每通道200 GT/s的双向数据速率,信号速率为212.5 GT/s,以适应前向纠错和编码开销。UALink可以配置为x1、x2或x4通道,其中四通道链路在发送和接收方向的速度最高可达800 GT/s。
单个UALink 1.0系统支持连接多达1024个AI加速器,通过UALink交换机连接,每个AI加速器分配一个端口和一个10-bit唯一标识符,以实现精确路由。UALink 电缆长度经过优化,长度小于4米,在64B/640B有效载荷下实现小于1µs的往返延迟。此外,这些链路支持跨一到四个机架的确定性性能。
在外界看来,UALink联盟的创立就是为了改变英伟达在人工智能芯片领域一家独大的格局,竞争目标是称为“NVLink”的互连通信协议。UALink 1.0规范允许在连接到处理器的内存之间直接传输数据,这对于AI训练工作负载尤其重要。
UALink 1.0规范发布对行业的影响解读
打破NVIDIA的生态垄断,推动行业多元化
NVIDIA凭借NVLink+InfiniBand的封闭生态,在AI加速器市场占据主导地位。UALink的推出标志着头部厂商联合“去NVIDIA化”,通过开放标准降低对单一供应商的依赖。为AMD、英特尔等GPU厂商提供跨品牌互联方案,加速其AI芯片(如AMD Instinct、Intel Gaudi)的市场渗透。 可能迫使NVIDIA调整策略,如开放部分技术或降低NVLink授权成本。
技术优势:更高带宽与扩展性
单链路带宽达1.5TB/s(双向),超越NVLink 4.0的900GB/s。
拓扑灵活性:支持直接GPU-GPU连接或通过UALink Switch扩展至数千节点,媲美InfiniBand的集群能力。
低延迟:针对AI训练/推理优化,减少数据同步开销。
应用场景:
大规模AI模型训练(如LLM、多模态模型)。
高性能计算(HPC)中的GPU密集型任务。
重构数据中心硬件生态
设备层:
加速专用交换芯片(如博通、思科)的研发,替代部分InfiniBand交换机市场。
推动PCIe 6.0+UALink的混合架构,提升服务器内/间互联效率。
软件层:
需配套开发统一驱动和通信库(类似NVIDIA的NCCL),兼容PyTorch、TensorFlow等框架。
可能催生新的RDMA协议优化方案。
对云计算与超算的影响
云服务商如Google Cloud、Azure):
可通过UALink构建异构加速器集群,灵活搭配AMD/Intel/自研芯片,降低TCO(总拥有成本)。
提供更细粒度的AI算力租赁服务(如单GPU到超大规模集群)。
替代传统InfiniBand方案,降低部署成本,同时满足AI与科学计算的双重需求。UALink 1.0的发布是AI基础设施领域的一次重要变革,其核心价值在于打破封闭、促进竞争。尽管面临生态建设挑战,但凭借联盟成员的行业影响力,有望重塑AI算力底层架构,最终受益的将是需要高性能、低成本互联方案的广大企业与研究机构。
平台近期组织的活动
*若有意向成为本次盛会的合作伙伴,请尽快联系我们预定*
加”GPMI接口供应链沟通群“加客服申请
工程参考学习资讯
更多关于最新的线缆行业发展讯息,请关注我们的微信公众号!我们将第一时间搜寻到行业前沿讯息和您一起分享!不做盈利用途,文中观点都是基于公开数据及信息,仅供交流,不构成投资建议!
热门跟贴