The Information援引参与Blackwell芯片制作人士称,最近几周出现了Blackwell设计问题,因为台积电的工程师在准备大规模生产时发现了缺陷。
GB200 芯片包含两个连接的 Blackwell GPU 和一个 Grace 中央处理单元。该缺陷问题涉及一个处理器芯片(一块用于容纳芯片电路的硅片),该芯片连接了两个Blackwell GPU。这一障碍降低了台积电能够为英伟达生产的芯片产量,甚至有可能使公司停止生产。
按照原计划,台积电将在第三季度开始大规模生产Blackwell芯片,并从第四季度开始交付给英伟达黄仁勋曾在5月份表示,公司计划在今年晚些时候出货大量Blackwell。
而这次的设计缺陷问题,或将使Blackwell主要芯片(B200和GB200)延迟3个月或更长时间,Blackwell大量生产延迟至明年Q1。
因为在收到芯片后,云提供商通常需要大约三个月的时间才能将其大规模集群投入运行。
设计缺陷还将影响 Nvidia NVLink 服务器机架的生产和交付,因为从事服务器工作的公司必须等待新的芯片样品,然后才能最终确定服务器机架设计。
此前,天风国际分析师郭明錤就指出,GB200 NVL36的算力优势无庸置疑,但也面临许多前所未见的设计与生产挑战,能否确保如期大量出货,答案存疑。
GB200 NVL36的每个机柜耗电约80kW,而根据AMAX今年四月的调查,目前全球少于5%的数据中心可以支持每机柜50kW服务器。所以,购买GB200 NVL36前,需先确保有没有足够空间安装。
GB200 NVL72的单一机柜版本每机柜耗电130kW,短期内无法量产。
算力底座短缺。
事不算大事,但时间节点就很微妙了
稻草能有多重呢?可是骆驼上已经坐着3个人了呀。

打开网易新闻 查看精彩图片