这几天,阿里和字节,不光在AI圈斗得厉害,两家的网工们,也不约而同地放了大招,先后“官宣”了自研的102.4T交换机。

这个是字节的B6020,4U,128个800G端口。

打开网易新闻 查看精彩图片

这是阿里的,俩规格:128个800G端口的Simba,64个1.6T端口的Kimba。(其实在去年云栖和OCP全球Summit上已经晒过了)

打开网易新闻 查看精彩图片

细节规格我们就不啰嗦了,大家可以看传送门。

1、字节的作文
2、阿里的作文

以下简要分析一下两家的异同。

打开网易新闻 查看精彩图片

相同点:芯出同门

相同点:芯出同门

不管大家怎么吹“自研”能力,但核心芯片都是大B哥家Tomahawk 6。

打开网易新闻 查看精彩图片

这就决定了那些特性都是你有、我有,大家都有。

这没办法,谁让互联网大厂们都希望拿大B哥来跟大C哥捅刀呢。

后面的鹅厂估计也是类似的(题外话:其实鹅的星脉网络3.0也有102.4T的方案了,只是没想像字节和阿里那么大张旗鼓官宣)。

不同点:单点秀和立体秀

不同点:单点秀和立体秀

先说字节,宇宙厂这次专注在介绍交换机的硬件、软件创新,简单总结下:

硬件创新,主要突出在PCB高速信号完整性设计,bump to bump只有20db损耗,以4U高的面板上128×800G OSFP,所有端口支持LPO。

也有别的厂是用fly cable来规避这种PCB走线的信号损耗,后面就等宇宙厂批量部署LPO的PR稿了

软件特性,最主要的就是定义SGLB协议,并且通过全局负载均衡、对称性负载均衡、us级路由收敛三个场景来介绍其跨设备的路径状态感知功能。

由于宇宙厂介绍非常硬,只有数学计算结果,不给逻辑推导过程,这里可以猜测一下:

打开网易新闻 查看精彩图片

①SGLB协议可能是从DNX内部的Credit机制改造而来,所以这种跨设备的全局负载均衡自然不在话。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

②对称性负责均衡的介绍是最烧脑的,这里还原一下,看完介绍就知道SGLB解决这个场景也是小case。

左S0与右S0之间有L3路由ECMP和L2 LAG ECMP两层;
当S1-1与右S0的LAG断掉1根800G时,S1-1到右S0互联带宽就只有2×800G;
根据ECMP,左S0-->S1-1和S1-2的流量是对等的,由于S1-1到右S0带宽只剩2 × 800G,所以左S0-->S1-2的带宽也不能超过2 × 800G;
也就是说左S0往右S0发送流量不得超过4×800G,否则S1-1到右S0方向就会丢包,影响整个应用,而左S0和S1-1之间的路由、LAG都不会变化,所以ECMP也不会变化,还是6条800G平均分配hash,那就是4×800G÷6=533G,这就是表格里6×533G的由来。

打开网易新闻 查看精彩图片

③最后路由us收敛也是利用了SGLB的跨设备链路状态感知能力,并将路由协议卸载到硬件上运行,实现了us收敛,并且给这个路由协议起了个非常厉害的名字SyncMesh。

打开网易新闻 查看精彩图片

软件另外一个看点就是μs级的telemetry,和显微镜一样,调节不同的放大倍率看清流量的微观细节。

这应该也是大B哥TH6的阳光普照特性,字节率先把自己的工程验证结果po了出来。

打开网易新闻 查看精彩图片

再说阿里,其实福报厂这次不止是秀102.4T交换机,而是给出了晒出了网络全家桶,凡尔赛感拉满的年终总结汇报。

打开网易新闻 查看精彩图片

阿里对102.4T交换机只有1句话“行业首个”,简单粗暴,之后就立体地介绍全域创新,并且call-back2025年云栖大会的展示成果:

自研的Stellar-RDMA,可以对打前段时间字节在Force大会发布的veRoCE;

Scale-Up组网UPN-512,用了512对SerDes的交换芯片做出了512 Radix的组网,可铜可光可LPO可NPO可CPO,可能是UALink的首个系统,以后是可以和NVLink、UB掰手腕的。

白盒交换机DCI和骨干网——eCore,利用盒子方便快速隔离的特性打造更稳定的DCI;

IPv6通过SRv6全方位渗透,RDMA和SRv6结合实现租户隔离,还让SONiC也支持SRv6为后面的学习者更快上手。

阿里这拨“扶贫”操作是想彻底把SRv6的生态给做扎实了,并把自己SRv6江湖老大的座位也做实了

光学进展,基本上是一笔带过OCS、光路故障定定位、传得更远的VCSEL激光器、昂贵的空心光纤等等,应该都在投产爬坡过程中。

同时阿里po出了许多获奖证书、顶级大会发表成果的统计数据等,证明自己在这方面的领先是不容任何竞争对手置喙的。

这么说吧,如果单独介绍一台102.4T交换机,阿里觉得太小case了,于是对2025年厚积薄发的表现做了一次雄浑、浓厚的总结报告。

单从这波秀肌肉来看,还是阿里的网络自研更立体、更吊一点,期待字节也来一波更立体的秀肌肉,以及后排的鹅、熊、老铁们。

打开网易新闻 查看精彩图片

如何看待大厂网络自研

如何看待大厂网络自研

技术上来看,大厂们都在努力地追求更强的自主掌控权,在当下无疑是非常符合复杂多变的国际形势的。

有一说一,在自主可控方面,大厂绝对是楷模,能自研的一定自研,配套自研的规范说建就建、说改就改,确实做不到的才会借助供应链,不管是态度还是结果上都已经做到了绝对领先。

但总觉得,这是不是就是把某H、某R的活给抢了,吃瓜群众们更期待的是,什么时候可以把大B哥的活也抢了。

革命尚未成功,同志仍需努力!

(本文作者:铁笼牛马,有删改)