近日,上海棣山科技对外披露其自主研发的2nm高端AI GPU芯片最新进展,标志着国产高性能计算芯片在前沿制程与生态兼容领域取得重大突破。
这款被命名为"棣山智核(DS-Core)"的芯片已达到国际前沿设计水平,目前正处于原型验证关键阶段,距离正式流片、量产预计仍需1-2年时间。
该款2nm AI GPU原型芯片采用行业领先的FinFET/GAA混合制程与Chiplet异构集成架构,核心晶体管数量达1700亿颗,接近英伟达B200的2080亿颗水平。芯片创新性地应用2.5D CoWoS-L先进封装技术,在提升集成度的同时降低信号延迟,为海量数据处理提供硬件基础。
研发团队成功攻克三大核心技术瓶颈:
第一项核心技术瓶颈突破是高带宽内存(HBM)封装互联技术。
为解决大模型训练时海量数据高速传输的痛点,棣山科技成功攻克HBM封装互联难题,为2nm AI GPU搭载了新一代HBM4内存。
该内存单颗容量高达48GB,引脚速率突破11Gb/s,内存带宽达到3.2TB/s,相较上一代HBM3E内存带宽提升约2.5倍,可高效承载AI大模型训练过程中巨量数据的实时读写与传输需求,打破了内存带宽不足对算力释放的限制,为芯片高性能发挥提供了坚实的内存支撑。
第二项核心技术瓶颈突破是超低延迟片间通信技术。
针对多芯片互联时信号延迟高、协同效率低的行业难题,研发团队实现了超低延迟片间通信技术的重大突破,将片间通信延迟控制在0.25ns/mm以内。
同时,该芯片支持NVLink 6兼容互连协议,单链路带宽达1.6TB/s,当多颗芯片进行互联协同运算时,可实现无瓶颈数据交互,有效提升整体算力规模,让芯片能够灵活应对大规模AI集群运算场景,进一步放大单芯片的算力优势。
第三项核心技术瓶颈突破是微流道高效热管理技术。
高端AI GPU在高负载运行时会产生大量热量,若散热不及时,极易导致芯片性能衰减、热失控等问题。
棣山科技研发的微流道高效热管理技术,通过优化芯片内部散热结构,大幅提升散热效率,使芯片热失控风险降低68%,能够将芯片工作温度稳定控制在85℃以下,这一突破有效解决了高端GPU高功耗下的散热难题。
性能表现上,棣山智核展现出强大算力实力。其FP32单精度算力达50 TFLOPS,FP16半精度算力达100 TFLOPS,FP4低精度算力更是高达400 TFLOPS,可灵活适配从大模型训练到边缘推理的全场景需求。能效比方面,该芯片较上一代产品提升40%,典型功耗控制在350W以内,每瓦算力达142 GFLOPS,在高性能与低功耗间实现出色平衡。
目前,棣山科技已与国内多家头部云厂商、自动驾驶企业达成预合作意向,待芯片正式商用后,有望在AI训练、科学计算、自动驾驶等领域打破国外垄断,推动国产高端芯片产业加速发展。
热门跟贴