你刚签下十万块GPU的订单,货也到了,电也通了,结果发现——训练任务排不上队。不是算力不够,是这帮芯片之间的连接方案还没调试通。
这就是眼下AI基础设施圈最真实的瓶颈。6月3日,Astera Labs公开了一个动作:扩大台湾地区的运营和云端规模互操作实验室。说白了,就是把验证环节往前移,挪到离制造最近的地方去做。
打开网易新闻 查看精彩图片
为什么要动这一步?跟芯片制程、晶体管密度那些话题没关系,完全是个工程落地问题。现在的AI机架级系统,里头塞着CPU、GPU、交换机、重定时器、线缆、固件、诊断工具,任何一环单独跑都正常,合在一起就是个黑盒子,不调不通。而且这堆东西来自不同供应商,谁家的锅都说不清。
Astera的逻辑很直接:既然最终交付的是能部署的平台,不是单独元器件,那验证也得在平台层面做。台湾是全半导体供应链的枢纽之一,把实验室扩在那里,等于把调试场地搬到了合作伙伴的家门口。
这次公布的协作名单拉得挺长,AMD、Arm、英特尔、英伟达,再加上技嘉、鸿佰科技、英业达、云达科技、纬颖——芯片设计方和系统集成方都覆盖到了。目标一致:缩短产品开发、除错和认证周期。
一个值得注意的数字是,今年第一季度Astera营收同比增长93%,达到3.084亿美元,驱动力来自其PCIe 6产品组合。抢着要的原因不复杂,谁能更快把验证跑通,谁的机架就能更早产生收入。
从产品线上看,Astera的整套方案围绕机架级AI基础设施设计,包括CXL、以太网、NVLink Fusion、PCIe、UALink这些连接技术,外加一套叫COSMOS的软件,解决的是扩展和横向扩展场景下的连接问题。不做算力,只负责让算力之间别在通信上卡脖子。
热门跟贴