在这场“抄袭门”大曝料中,提到了一个问题,核心原因就是“算力资源严重不足”,曾经他们都说自己的AI芯片性能已经媲美NVIDIA的AI芯片了,如今却又说“算力资源严重不足”,这无疑揭示了他们的AI芯片性能其实与NVIDIA差距甚大。
一直以来,国产AI芯片都强调他们的AI芯片性能已接近NVIDIA的顶级AI芯片,他们拿出了许多参数来证明,然而参数有时候并不可靠,芯片的性能表现得在实际使用中才能证明他们的真实性能。
2024年在智算融合创新发展论坛上,就有业内人士指出,由于优化、软件配合等方面的因素影响,国产AI芯片的实际表现远未达到预期,大约只是原预期的大约10%左右,与参数存在巨大的差距。
事实上即使是拥有先进架构设计的NVIDIA也不得不寻求最先进的芯片工艺,以提升性能的同时降低功耗,为此NVIDIA的最新AI芯片已采用了先进的3纳米工艺,借此控制AI芯片的发热问题。
即使如此,NVIDIA的Blackwell架构AI芯片在配置72颗处理器的服务器中,仍然出现过热问题,为此NVIDIA和它的客户不得不修改机架设计,控制芯片性能,避免发热太严重导致损坏硬件的后果。
相比之下,国产AI芯片大多还在用7纳米工艺,7你们工艺的功耗远比3纳米高得多,严重的发热问题,会进一步阻碍国产AI芯片提升性能,他们的性能很可能与标称参数存在巨大的差距。
上述提到的NVIDIA用了先进的3纳米工艺和更先进的芯片架构之后,仍然无法搭载过多的AI芯片核心,证明了散热已成为AI芯片提升性能的重要障碍;相比之下,国产AI芯片在采用了更落后的7纳米工艺之后,试图用芯片堆叠的方式提升芯片性能,如何解决散热问题?
事实上,多芯片堆叠的另一个问题则是AI芯片之间的物理距离还会影响到芯片性能,这从NVIDIA为了缩减AI芯片和存储芯片的物理距离等,而将AI芯片和HBM存储芯片封装在一起,进而提升芯片整体性能可以看出来,如此情况下,芯片堆叠导致的物理距离也会影响着芯片性能。
此前还曾传出,NVIDIA因为众所周知的原因无法对中国企业出售先进的AI芯片,而不得不持续阉割AI芯片的性能,以满足相关的要求,推出的H20芯片阉割了八成的性能,但是仍然受到中国AI企业的追捧,这似乎也反映出国内企业更认可NVIDIA的AI芯片性能,而对国产AI芯片持保留态度。
这种种问题,都证明了国产AI芯片的实际性能与NVIDIA存在不小的差距,只是因为种种原因而未为公众所知,直到这次的抄袭门,再次让业界关注到了国产AI芯片性能,那么国产AI芯片的实际性能表现到底是如何的呢?
热门跟贴