5月26日,英伟达对台积电的最高优先级芯片订单急剧增加,导致台积电的5纳米生产线全面负载运作。

打开网易新闻 查看精彩图片

这些来自英伟达的紧急订单包括H100、A100、H800和A800等AI GPU。过去,通常只有苹果会下此类紧急订单,而如今英伟达大量订单的涌入,让台积电既感压力又有喜悦。
随着2023年初ChatGPT的爆火,AI芯片需求急剧上升,英伟达因此站上了行业风口,一时无两。
然而,国产AI芯片却未能及时跟上这一趋势,无论是研发、设计还是制造都远落后于英伟达。国内企业为了推动AI产业发展,甚至不得不购买英伟达的“残血版”芯片。
那么,英伟达到底有多强大?国产AI芯片真的无法竞争吗?
英伟达作为GPU领域的领头羊,其市值已达到9632亿美元(约合68054亿人民币),相当于贵州茅台(2.12万亿)、工商银行(1.71万亿)、中国移动(2万亿)以及宁德时代(9672亿)的总和。

打开网易新闻 查看精彩图片

在市场份额方面,英伟达在独立显卡市场占有88%的份额,在AI数据中心GPU领域控制着90%的市场,在全球AI市场领域,英伟达的份额超过80%。
英伟达的GPU已广泛应用于人工智能、超级计算、量子加速、自动驾驶、互联网、光刻技术等多个领域,未来其应用范围还将持续扩大,渐渐影响各行各业。
让我们来详细了解一下英伟达的AI芯片究竟有多厉害。
2023年3月21日,英伟达在GTC开发者大会上,黄仁勋在76分钟内介绍了公司的多款新产品,其中包括:
对于任何企业来说,拥有自己的AI大模型是必要的。如果没有,可以使用开放的ChatGPT,并对其进行训练。考虑到训练ChatGPT需要大量的算力,普通企业无法自行开发或负担昂贵的新GPU,这时候怎么办?
英伟达提供的AI云服务DGX Cloud,包含8个A100芯片,足以在云端训练ChatGPT。任何企业只需支付月租费(3.7万美元),即可轻松参与人工智能大模型的业务,无需等待计算资源。
此外,英伟达还发布了用于2nm制造的突破性计算光刻技术—

打开网易新闻 查看精彩图片

—NVIDIA cuLitho计算光刻库。
芯片在设计和制造过程中需要大量的计算资源。随着芯片制程的缩小和晶体管数量的增加,传统的CPU计算方法已变得非常耗时。
英伟达的GPU方案可以将计算速度提升40倍,显著加快芯片设计和制造的速度。例如,原本需要两周才能完成的掩膜版,现在可以在8小时内完成。
这一方案已经吸引了台积电、新思科技、ASML等芯片产业链巨头的关注。
在这场长达76分钟的发布会中,英伟达展示了一系列强大的新产品,任何一项都足以让其他芯片企业追赶多年。英伟达能够取得这样的成就,归功于其强大的“算力”。
在AI时代,算力是关键。随着数字经济和人工智能的快速发展,未来算力将成为经济的基石。根据IDC的研究报告,算力每提高1点,国家的数字经济和GDP将分别增长3.5%和1.8%。
如今,算力芯片的控制权在英伟达手中,根据公开资料,全球前500的超级计算机中,70%使用了英伟达的GPU,而最新的超算使用比例达到了90%。AI大模型更是离不开英伟达的支持。
黄仁勋曾表示,在过去十年中,摩尔定律的性能提升了100倍

打开网易新闻 查看精彩图片

,而英伟达的GPU性能则提升了100万倍。未来十年,尽管摩尔定律可能会失效,但“黄氏定律”不会。根据这一定律,英伟达将在未来十年使人工智能的性能提高100万倍,实现人工智能的真正觉醒。
H100采用了Hopper架构,由台积电4纳米工艺制造,拥有18432个CUDA核心、576个Tensor核心和60MB的二级缓存。这款GPU集成了800亿个晶体管,其算力达到了2000 TFLOPS,比上一代A100的算力提高了3.2倍,整体性能提升了6倍。
H100 GPU的动态加速和路径优化功能显著提高了其性能,可达到原算力的7倍。
在数据处理能力方面,H100同样表现出色,达到3TB/s的显存带宽和5TB/s的网络速度。
H100的另一个亮点是其GPU分割功能,可以将一个单元分割成7个独立单元,每个单元的性能都可以提升7倍。

打开网易新闻 查看精彩图片

其售价高达24万人民币,相当于一辆高端轿车的价格。尽管如此,对于专业需求的用户来说,这样的投资仍然物有所值,尤其是考虑到产品的限量性。
凭借这款强大的GPU,英伟达的未来非常令人期待。
在过去几十年中,英特尔在芯片领域占据主导地位,而未来几十年可能将属于英伟达。英伟达的CEO黄仁勋宣布,AI的黄金时代已经到来,这一切都归功于英伟达的创新。
关于国产AI芯片的发展,百度、华为、360、腾讯等国内大企

打开网易新闻 查看精彩图片

业也在快速进入AI领域,并宣布开发AI大模型。然而,核心的算力芯片是基础,没有足够的算力,即使是华为也难以竞争。
值得欣慰的是,国内AI芯片制造商如景嘉微、寒武纪、壁仞科技、燧原科技、瀚博半导体等也在积极研发。
景嘉微的芯片主要应用于军事和工业领域,尚未进入大模型市场,原因是算力不足。
寒武纪开发的芯片尚未得到华为的认可,其性能有待验证。
目前,唯一能与英伟达H100相匹敌的国产AI芯片是壁仞科技生产的。
在2022年世界人工智能大会上,壁仞科技的BR100系列成为了

打开网易新闻 查看精彩图片

国内AI芯片的标杆。
BR100采用台积电7nm工艺,单芯片的峰值算力达到千万亿次浮点运算,刷新了多项GPU性能记录,足以与英伟达的H100相媲美。
一些博主将BR100与H100进行了详细比较:
英伟达的H100采用台积电4nm工艺,拥有800亿晶体管,16位浮点算力达到1000T、8位定点算力达到2000T,稀疏模式下算力可以翻倍。
(http://www.superst.com.cn)
来源:http://www.twll.com.cn
(http://www.jiongr.cn)
来源:http://www.zfkuaidi.cn
(http://www.wsygw.cn)

打开网易新闻 查看精彩图片

来源:http://www.hzhdisk.cn
(http://www.jnhlxs.cn)
来源:http://www.budha.com.cn
(http://www.sd315.cn)
来源:http://www.neodymium-magnets-brand.cn
(http://www.polowang.cn)
来源:http://www.daiyunnh.cn
(http://www.gtlvb.cn)
来源:http://www.loushai.cn
(http://www.ut62.cn)
来源:http://www.nbyyrc.cn
(http://www.dwxw.com.cn)
来源:http://www.saonuan.cn
(http://www.x-lohas.com.cn)
来源:http://www.mreu.cn
BR100的16位浮点算力超过1000T、8位定点算力超过2000T,单芯片的峰值算力达到PFLOPS级别,显示出与H100不相上下的性能。
然而,单从算力对比而言只是一方面,真正的使用效果还有待验证,考虑到AI性能、显存带宽、通信速度、功耗和生态系统等因素。
尽管如此,目前还未有大型模型使用数百个BR100的报道,因此真正的性能比较还未开始。
在深入了解壁仞科技后,发现它是一家拥有众多资深工程师的初创公司。例如,焦国方,具有30年GPU技术经验,曾在华为和高通任职;洪洲,在英伟达和华为有着丰富的GPU架构经验;唐杉,在新思科技担任AI芯片架构师;张凌岚,在海光、三星及AMD担任GPU SOC架构工作;李新荣,前AMD全球副总裁;徐凌杰,曾在阿里云、三星、AMD及英伟达任职。
虽然壁仞科技在人才储备方面颇为突出,但与英伟达在规模和数量上仍有很大差距。
英伟达的研发团队已超过2万人,且持续增长,公司有充足的资金来招募和保留顶尖人才。
这些从英伟达、AMD、高通等公司来的工程师是否可能在研发过程中面临“侵犯专利”的法律风险,如同中芯国际与台积电之间的诉讼一样?
此外,制造能力也是一个关键因素。
目前中国大陆的中芯国际的制造水平停留在12nm,而壁仞科技的产品已进入到7nm阶段,未来还计划进一步发展到5nm、4nm。如果这些性能上的提升真的威胁到了英伟达,是否会引发类似“华为事件”的政治和经济干扰?
所以,虽然国产AI芯片设计上取得了进展,但大规模的量产和应用才是更关键的挑战。
总结来看,AI时代已经到来,英伟达依靠其强大的研发实力和台积电的先进制造技术,几乎无敌于市场上。
尽管国内芯片制造商在研发和制造上与英伟达和台积电存在差距,但未来壁仞科技联合中芯国际是否能在AI芯片领域实现重大突破,仍是一个值得关注的问题。
#深度好文计划#