公众号记得加星标⭐️,第一时间看推送不会错过。

现代人工智能数据中心——实际上,如今更像是一个数据星系,因为人工智能的处理需求早已远远超出单个数据中心,甚至在少数极端情况下,也超出了同一区域内多个数据中心的范畴——其网络存在两个瓶颈。一是数据中心互连,它构建了一个路由器骨干网,将多个数据中心连接成一个单一的计算集群;二是后端网络,它在数十个、未来甚至数百或数千个GPU或XPU之间创建一个单一的内存域,这是专家训练和推理混合应用的最佳粒度。

去年秋天,思科推出了“暗金字塔”P200路由器芯片,解决了数据中心互连问题。该芯片是不断壮大的Silicon One产品线的一部分,思科在自己的交换机和路由器中使用,超大规模数据中心运营商和云构建商也在定制设备中使用。

本周,在阿姆斯特丹举行的 Cisco Live 大会上,思科推出了 G300 ASIC,进一步提升了交换机的带宽。该芯片可提供 102.4 Tb/S的聚合带宽,旨在与博通和英伟达展开竞争,争夺 1.6 Tb/s端口的市场份额,用于连接后端网络中的 GPU 和 XPU。此外,思科还将通过更高基数的交换机提供 800 Gb/秒端口,从而提升前端网络的性能,使网络更加扁平化,并大幅降低网络成本。

我们尚不清楚G300芯片的代号,但我们知道它在基本性能和速度上都与2023年6月发布的G200交换机ASIC芯片相差无几。G200的推出初衷就是为了在AI和HPC集群的横向扩展网络中挑战InfiniBand。早在2025年5月,G200就凭借其更具可扩展性和更低成本的优势,开始在相关领域崭露头角。但毋庸置疑,英伟达仍然在销售大量的InfiniBand横向扩展网络,并且凭借用于连接GPU内存的后端纵向扩展网络的NVSwitch互连芯片,赚取了巨额利润。

G200 和现在的 G300 ASIC 芯片专门设计用于提供一种性能大幅提升且结构精简的以太网,它能够实现 InfiniBand 的优势——高带宽、低延迟、自适应路由和拥塞控制——同时保留 InfiniBand 所缺乏的以太网的诸多优点,例如安全性、微隔离以及多厂商竞争。InfiniBand 的芯片来源单一,这已成为部分用户的顾虑所在。

打开网易新闻 查看精彩图片

今天,G300 与新的 Nexus 9000 和 Cisco 8000 系统、可插入这些系统的新型可插拔光模块以及网络操作系统和控制平面更新一同发布,以便更轻松地管理使用基于 G300 交换机的 AI 系统的更大规模扩展网络或更强大的前端网络。

思科尚未提供关于G300 ASIC的详细技术信息,因此我们无法分享该芯片的框图或G300交换机的原理图。但我们确实从思科高级副总裁兼Silicon One研发负责人Rakesh Chopra那里获得了一些基本信息,包括速度和见解。

打开网易新闻 查看精彩图片

与 G200 一样,G300 也拥有 512 个 SerDes 电路模块用于创建端口,所有模块都围绕一个数据包处理引擎封装。两者都为每个 SerDes 分配一个以太网 MAC 地址,从而实现端口和 MAC 地址的一对一映射。(许多交换机 ASIC 每个 SerDes 的 MAC 地址数量只有 G300 的一半,如果您聚合多个 SerDes 来创建特定带宽的端口,这当然没问题。但如果您想减少端口数量,创建一个具有更多低带宽端口的高基数交换机呢?那么您就会面临 MAC 地址不足的问题。)

与去年秋季发布的 P200 一样,G300 也采用了所谓的“无盖”芯片设计,这意味着封装盖已被移除,以便将用于空气冷却的散热片和用于液体冷却的模块直接安装在芯片上,从而更有效地带走其热量。

思科于 2022 年 10 月推出的 25.6 Tb/秒 G100 交换机 ASIC采用台积电 (TSMC) 的 7 纳米工艺制造,而 2023 年夏季推出的 G200 则采用台积电的 5 纳米工艺制造。G300 配备了 252 MB 的 SRAM 缓存,我们认为这至少是 G200 缓存容量的两倍,并且配备了数量不变的高速 SerDes 芯片。因此,我们认为思科选择了台积电的多种工艺来制造 G300。G300 采用多芯片设计,如果非要我们猜测,我们会认为数据包处理引擎芯片模块及其 SRAM 缓存采用的是 3 纳米工艺制造,而环绕在其周围的 SerDes 芯片则采用台积电较为成熟的 4 纳米工艺(基于 5 纳米工艺的改进版)制造。缩小信号电路比缩小计算电路更难,而且使用 3 纳米技术也比使用 4 纳米技术更昂贵。

打开网易新闻 查看精彩图片

Chopra 表示,这 252 MB 的缓冲区是所有 512 个 SerDes 共用的单一统一缓冲区,不像其他一些设计那样为了支持交换机 ASIC 上的 SerDes 组而进行分段。因此,它不仅容量更大,而且是所有 SerDes 共用的单一内存,这提高了运行效率,尤其是在网络拥塞严重的情况下,缓冲区可以防止以太网丢包并导致数据包损坏。

这个大容量缓冲区与一组片上硬件负载均衡代理相结合,这些代理可以监控交换机内部,了解流量流经交换机的情况,并绘制流量图,包括拥塞和传输故障,从而优化网络中所有 G300 交换机的流量。该软件采用算法,但严格来说并非人工智能。而且,与所有 Silicon One 芯片一样,G300 完全可以使用 P4 网络编程语言进行编程,并可根据市场需求随时创建新的特性和功能。

打开网易新闻 查看精彩图片

G300 中使用的 SerDes 由 Cisco 设计,编码前传输速率为 224 Gb/s,编码后为 200 Gb/s。(我们推测 SerDes 的原生信令时钟频率为 112 Gb/s,通过 PAM4 调制倍频至 224 Gb/s,PAM4 调制每个信号可传输两位数据。)顺便一提,这是 Cisco 推出的首款 200 Gb/s SerDes。

如果你愿意,你可以使用 G300 芯片创建一个 512 端口交换机,每个端口运行速度为 200 Gb/秒;或者创建一个 256 端口交换机,每个端口运行速度为 400 Gb/秒;创建一个 128 端口交换机,每个端口运行速度为 800 Gb/秒;或者创建一个 64 端口交换机,每个端口运行速度高达 1.6 Tb/秒,这听起来仍然令人惊叹。

顺便一提,G300 可以直接驱动线性可插拔光模块 (LPO),每个端口的传输速率可达 800 Gb/s,思科也提供一款可与采用 G300 的交换机配套使用的 LPO 模块。此外,思科还为选择使用 G300 驱动 1.6 Tb/s 端口的用户提供其自主研发的 1.6 Tb/s OSFP 可插拔光模块。这些光模块均基于思科自主研发的芯片,而非第三方产品。(英伟达和博通也提供此类组件的一站式服务。)但有趣的是,思科也在为那些需要更多选择或希望通过补充供应商来降低整个供应链风险的客户,开发基于第三方 DSP 的可插拔模块。

通过迁移到LPO(光模块),可以大幅节省电力,从而可以将更多电力分配给计算引擎。Chopra表示,光模块的功耗可降低约50%,而人工智能集群中整个交换基础设施的功耗可降低约30%。这意义重大。

部分客户需要更高的带宽来应对预计在 2026 年下半年推出的 GPU 和 XPU,因此他们会愿意支付额外的功耗来获得 1.6 Tb/s 的端口。而另一些客户则持观望态度,认为 800 Gb/s 的带宽已经足够,因此低功耗的 LPO 模块是更佳选择。

Chopra 表示,综合所有因素并根据带宽进行标准化后,G300 的网络利用率比 G200 和该领域的许多竞争对手高出 33%,作业完成速度快 28%。

“此次发布会的亮点之一,是我们拥有了尖端技术,但我们对光模块的测试和认证方式却是独一无二的,”乔普拉自豪地说道。“我们的测试体系比业内其他公司要全面得多。原因在于,人工智能工作负载是同步的,单个光模块的故障与前端网络故障截然不同。它会导致人工智能作业重启——你必须回到之前的检查点并重新开始。”

思科正在多款设备中使用 G300 芯片。对于风冷设备,G300 芯片被应用于运行思科自研 NX-OS 操作系统的 Nexus N9364-SG3 以及运行开源 SONiC 网络操作系统的 Cisco 8133 中。

打开网易新闻 查看精彩图片

这些交换机占用 3U 机架空间,有 64 个端口,运行速度为 1.6 Tb/秒。

如果您想要更紧凑的体积、液冷散热以及开放式机架配置,那么可以考虑运行 NX-OS 的 Nexus N9363-SG2 或运行 SONiC 的 Cisco 8132。这是一款 21 英寸宽的设备,符合开放计算项目 (Open Compute Project) 的 Orv3N 规范。

下面我们来仔细看看这款水冷式开关:

打开网易新闻 查看精彩图片

其结果是,如果您想在纵向网络中的 GPU 之间或在横向网络中的服务器节点及其 GPU 之间提供 102.4 Tb/秒的聚合连接,以前需要六个 G200 设备交叉耦合,而现在只需要一个 G300 即可。

打开网易新闻 查看精彩图片

这也意味着,即使G300的价格是G200的三到四倍,与G200相比仍然会让人觉得物超所值。我们并不清楚它的实际成本,但在人工智能出现之前,通常情况下,新的ASIC芯片成本大约是旧芯片的1.5倍,才能提供两倍的单芯片带宽。

对于推动 GenAI 革命的公司来说,70% 的电力效率提升意义重大,因为这些公司是以千兆瓦为单位购买电力容量的。

打开网易新闻 查看精彩图片

除了 G300 及其交换机和光模块之外,思科本周还进一步完善了 P200 产品线。去年秋季,思科首次推出了搭载 P200 芯片的 51.2 Tb/s DCI 链路路由器,该路由器配备 64 个 800 Gb/s 端口。现在,思科不仅在商用级 Nexus 设备中提供 P200 芯片,还在其 Nexus 和白盒模块化交换机的线卡中提供该芯片。

https://www.nextplatform.com/2026/02/10/cisco-doubles-up-the-switch-bandwidth-to-take-on-ai-scale-up-and-scale-out/

(来源:编译自nextplatform)

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4315期内容,欢迎关注。

加星标⭐️第一时间看推送

求推荐