英伟达、台积电合作发力AI芯片,国产芯片市场或将受冲击?|amd|gpu|台积电|平均售价|英伟达|高通|黄仁勋

5月26日，英伟达对台积电的最高优先级芯片订单急剧增加，导致台积电的5纳米生产线全面负载运作。

这些来自英伟达的紧急订单包括H100、A100、H800和A800等AI GPU。过去，通常只有苹果会下此类紧急订单，而如今英伟达大量订单的涌入，让台积电既感压力又有喜悦。
随着2023年初ChatGPT的爆火，AI芯片需求急剧上升，英伟达因此站上了行业风口，一时无两。
然而，国产AI芯片却未能及时跟上这一趋势，无论是研发、设计还是制造都远落后于英伟达。国内企业为了推动AI产业发展，甚至不得不购买英伟达的“残血版”芯片。
那么，英伟达到底有多强大？国产AI芯片真的无法竞争吗？
英伟达作为GPU领域的领头羊，其市值已达到9632亿美元（约合68054亿人民币），相当于贵州茅台（2.12万亿）、工商银行（1.71万亿）、中国移动（2万亿）以及宁德时代（9672亿）的总和。

在市场份额方面，英伟达在独立显卡市场占有88%的份额，在AI数据中心GPU领域控制着90%的市场，在全球AI市场领域，英伟达的份额超过80%。
英伟达的GPU已广泛应用于人工智能、超级计算、量子加速、自动驾驶、互联网、光刻技术等多个领域，未来其应用范围还将持续扩大，渐渐影响各行各业。
让我们来详细了解一下英伟达的AI芯片究竟有多厉害。
2023年3月21日，英伟达在GTC开发者大会上，黄仁勋在76分钟内介绍了公司的多款新产品，其中包括：
对于任何企业来说，拥有自己的AI大模型是必要的。如果没有，可以使用开放的ChatGPT，并对其进行训练。考虑到训练ChatGPT需要大量的算力，普通企业无法自行开发或负担昂贵的新GPU，这时候怎么办？
英伟达提供的AI云服务DGX Cloud，包含8个A100芯片，足以在云端训练ChatGPT。任何企业只需支付月租费（3.7万美元），即可轻松参与人工智能大模型的业务，无需等待计算资源。
此外，英伟达还发布了用于2nm制造的突破性计算光刻技术—

—NVIDIA cuLitho计算光刻库。
芯片在设计和制造过程中需要大量的计算资源。随着芯片制程的缩小和晶体管数量的增加，传统的CPU计算方法已变得非常耗时。
英伟达的GPU方案可以将计算速度提升40倍，显著加快芯片设计和制造的速度。例如，原本需要两周才能完成的掩膜版，现在可以在8小时内完成。
这一方案已经吸引了台积电、新思科技、ASML等芯片产业链巨头的关注。
在这场长达76分钟的发布会中，英伟达展示了一系列强大的新产品，任何一项都足以让其他芯片企业追赶多年。英伟达能够取得这样的成就，归功于其强大的“算力”。
在AI时代，算力是关键。随着数字经济和人工智能的快速发展，未来算力将成为经济的基石。根据IDC的研究报告，算力每提高1点，国家的数字经济和GDP将分别增长3.5%和1.8%。
如今，算力芯片的控制权在英伟达手中，根据公开资料，全球前500的超级计算机中，70%使用了英伟达的GPU，而最新的超算使用比例达到了90%。AI大模型更是离不开英伟达的支持。
黄仁勋曾表示，在过去十年中，摩尔定律的性能提升了100倍

，而英伟达的GPU性能则提升了100万倍。未来十年，尽管摩尔定律可能会失效，但“黄氏定律”不会。根据这一定律，英伟达将在未来十年使人工智能的性能提高100万倍，实现人工智能的真正觉醒。
H100采用了Hopper架构，由台积电4纳米工艺制造，拥有18432个CUDA核心、576个Tensor核心和60MB的二级缓存。这款GPU集成了800亿个晶体管，其算力达到了2000 TFLOPS，比上一代A100的算力提高了3.2倍，整体性能提升了6倍。
H100 GPU的动态加速和路径优化功能显著提高了其性能，可达到原算力的7倍。
在数据处理能力方面，H100同样表现出色，达到3TB/s的显存带宽和5TB/s的网络速度。
H100的另一个亮点是其GPU分割功能，可以将一个单元分割成7个独立单元，每个单元的性能都可以提升7倍。

其售价高达24万人民币，相当于一辆高端轿车的价格。尽管如此，对于专业需求的用户来说，这样的投资仍然物有所值，尤其是考虑到产品的限量性。
凭借这款强大的GPU，英伟达的未来非常令人期待。
在过去几十年中，英特尔在芯片领域占据主导地位，而未来几十年可能将属于英伟达。英伟达的CEO黄仁勋宣布，AI的黄金时代已经到来，这一切都归功于英伟达的创新。
关于国产AI芯片的发展，百度、华为、360、腾讯等国内大企

业也在快速进入AI领域，并宣布开发AI大模型。然而，核心的算力芯片是基础，没有足够的算力，即使是华为也难以竞争。
值得欣慰的是，国内AI芯片制造商如景嘉微、寒武纪、壁仞科技、燧原科技、瀚博半导体等也在积极研发。
景嘉微的芯片主要应用于军事和工业领域，尚未进入大模型市场，原因是算力不足。
寒武纪开发的芯片尚未得到华为的认可，其性能有待验证。
目前，唯一能与英伟达H100相匹敌的国产AI芯片是壁仞科技生产的。
在2022年世界人工智能大会上，壁仞科技的BR100系列成为了

国内AI芯片的标杆。
BR100采用台积电7nm工艺，单芯片的峰值算力达到千万亿次浮点运算，刷新了多项GPU性能记录，足以与英伟达的H100相媲美。
一些博主将BR100与H100进行了详细比较：
英伟达的H100采用台积电4nm工艺，拥有800亿晶体管，16位浮点算力达到1000T、8位定点算力达到2000T，稀疏模式下算力可以翻倍。
(http://www.superst.com.cn)
来源:http://www.twll.com.cn
(http://www.jiongr.cn)
来源:http://www.zfkuaidi.cn
(http://www.wsygw.cn)

来源:http://www.hzhdisk.cn
(http://www.jnhlxs.cn)
来源:http://www.budha.com.cn
(http://www.sd315.cn)
来源:http://www.neodymium-magnets-brand.cn
(http://www.polowang.cn)
来源:http://www.daiyunnh.cn
(http://www.gtlvb.cn)
来源:http://www.loushai.cn
(http://www.ut62.cn)
来源:http://www.nbyyrc.cn
(http://www.dwxw.com.cn)
来源:http://www.saonuan.cn
(http://www.x-lohas.com.cn)
来源:http://www.mreu.cn
BR100的16位浮点算力超过1000T、8位定点算力超过2000T，单芯片的峰值算力达到PFLOPS级别，显示出与H100不相上下的性能。
然而，单从算力对比而言只是一方面，真正的使用效果还有待验证，考虑到AI性能、显存带宽、通信速度、功耗和生态系统等因素。
尽管如此，目前还未有大型模型使用数百个BR100的报道，因此真正的性能比较还未开始。
在深入了解壁仞科技后，发现它是一家拥有众多资深工程师的初创公司。例如，焦国方，具有30年GPU技术经验，曾在华为和高通任职；洪洲，在英伟达和华为有着丰富的GPU架构经验；唐杉，在新思科技担任AI芯片架构师；张凌岚，在海光、三星及AMD担任GPU SOC架构工作；李新荣，前AMD全球副总裁；徐凌杰，曾在阿里云、三星、AMD及英伟达任职。
虽然壁仞科技在人才储备方面颇为突出，但与英伟达在规模和数量上仍有很大差距。
英伟达的研发团队已超过2万人，且持续增长，公司有充足的资金来招募和保留顶尖人才。
这些从英伟达、AMD、高通等公司来的工程师是否可能在研发过程中面临“侵犯专利”的法律风险，如同中芯国际与台积电之间的诉讼一样？
此外，制造能力也是一个关键因素。
目前中国大陆的中芯国际的制造水平停留在12nm，而壁仞科技的产品已进入到7nm阶段，未来还计划进一步发展到5nm、4nm。如果这些性能上的提升真的威胁到了英伟达，是否会引发类似“华为事件”的政治和经济干扰？
所以，虽然国产AI芯片设计上取得了进展，但大规模的量产和应用才是更关键的挑战。
总结来看，AI时代已经到来，英伟达依靠其强大的研发实力和台积电的先进制造技术，几乎无敌于市场上。
尽管国内芯片制造商在研发和制造上与英伟达和台积电存在差距，但未来壁仞科技联合中芯国际是否能在AI芯片领域实现重大突破，仍是一个值得关注的问题。
#深度好文计划#