公众号记得加星标⭐️,第一时间看推送不会错过。
毫无疑问,在过去的30年里,GPU与CPU一起,在讨论PC配置时一直占据着“核心”地位。“GPU”是“图形处理单元”(Graphics Processing Unit)的缩写,这个术语本身相对较新,它是由NVIDIA在1999年发布其显卡“GeForce 256”时创造的。
GPU 的主要功能是处理 PC 中的屏幕渲染和视频输出。它以前被称为“视频芯片”,而集成它的扩展板,即“显卡(视频板)”,曾是 PC 的核心部件之一,本质上是一个幕后组件。如今,GPU 在提升 3D 游戏速度的同时,也已成为人工智能时代的主导力量。
在本文中,我想回顾一下 GPU 的发展历程,重点关注那些让我能够热情地讨论其整体发展以及它们如何确立自身地位的里程碑事件,并结合我当时的记忆和印象进行探讨。
Windows 之前的 GPU 现状
在回顾GPU发展史之前,让我先讲个小故事。在DOS/V标准在日本普及之前,尤其是在20世纪80年代到90年代初,日本的个人电脑行业就像今天的苹果公司一样,每个日本厂商都开发并销售自己的专有产品,例如NEC的“PC-9800”系列、夏普的“X1”和“X68000”系列,以及富士通的“FM”系列。或许唯一的例外是“MSX”,它按照既定标准开发、制造和销售硬件。
当时,人们对此习以为常,并未深思。在那个年代,一台个人电脑通常由一家公司研发、生产和销售,因此,作为电脑大脑的“CPU”往往被重点宣传为产品的门面,而“显卡”的存在却鲜为人知,甚至很少有人了解它。当时个人电脑的性能本来就不高,所以为了吸引用户,厂商在宣传性能提升时,可能更倾向于强调CPU的处理能力。当然,也曾有过强调显示色彩数量、渲染色彩数量等视觉参数的时候,但显卡在这方面却很少被大肆宣传。
一个明显的例子是,在讨论当时的家用游戏机时,人们经常使用“8位”和“16位”这样的术语,例如任天堂的“Family Computer (Famicom)”和“Super Famicom”。当然,游戏机之间的性能差异并非仅仅取决于CPU;图像处理更为重要。然而,在当时,这主要是专业游戏开发者和爱好者关注的焦点,大多数用户对此并不了解。
此外,当时还没有像“GPU”这样的词来专门指代视频芯片。例如,前面提到的“MSX”中的视频芯片被称为“VDP(视频显示处理器)”,而任天堂的FC游戏机则将负责图像处理的芯片称为“PPU(图像处理单元)”。这种命名上的不统一很可能是造成这种现象的原因之一。
20世纪90年代末的混战
在Windows 95取得爆炸性成功几年后,NEC的“PC-9800”在日本的魔咒开始逐渐消退。随着DOS/V定制PC逐渐主导PC市场,人们开始慢慢意识到,PC的性能并非仅靠CPU就能实现,主板、内存、显卡和声卡等多个组件都至关重要。
正如我在之前的文章《CPU兴衰三十年史》中提到的,我买的第一台台式电脑是富士通的“FMV DESKPOWER T16”。它配备了一块S3显卡“S3 ViRGE/VX”,这标志着我第一次接触到“GPU”(图形处理器)。然而,起初我对显卡完全不感兴趣。我认为CPU才是电脑最重要的组件。但渐渐地,我开始对当时经常在电脑杂志上看到的一款显卡产生了兴趣。那就是Matrox的“Millennium”。
当时我用的是Windows 95,一个主要基于二维图形用户界面的操作系统,所以Matrox的“Millennium”据说拥有极高的二维渲染性能,这对我来说非常有吸引力。我觉得我绝对不能错过这个机会!于是我费尽周折才把它弄到手,我还记得它出色的二维渲染性能让我非常惊喜。
Matrox Millennium
此外,令人印象深刻的不仅仅是绘制速度;图像清晰锐利,色彩绚丽夺目,给人留下了“画面精美绝伦”的深刻印象。现在回想起来,这或许像是模拟时代的幻觉,但当时我却坚信“千禧年”显卡是最好的!我简直是个狂热的拥趸,甚至宣称“其他显卡都是垃圾!” 我现在只记得那尴尬的一幕。
当时,我基本上只想要一块“2D渲染性能高”的显卡。所以,仅仅拥有“千禧年”显卡并不能满足我的需求。当我听说“Cirrus Logic”显卡很轻薄时,就买了一块。后来,我又听说稍老一些的Tseng Labs“ET6000”性能也很强,于是买了一块二手的来试试。就这样,我买了各种各样的显卡,自己进行评测,即使并不真正理解它们,也能发表自己的看法,这让我相当得意。
Cirrus Logic CL-GD5434 显卡
对我而言,这个时期恰逢DOS/V操作系统问世,所以我当时只关注CPU、内存、硬盘、2D显卡等主要组件的价格走势和性能,对整个行业的趋势并不了解。然而,与此同时,一股名为“3D”的新浪潮也正悄然席卷PC行业。
大约在1996年,3Dfx的“Voodoo”显卡在DIY PC组装爱好者中几乎被奉为神明。当时,2D渲染是显卡的主流,而3D功能才刚刚开始被集成到芯片中,Voodoo却突然以“专用3D显卡”的身份出现,甚至还配备了自己的API“Glide”。在搭载Voodoo显卡的PC上运行使用Glide开发的游戏,可以获得当时极其流畅的3D渲染效果,这使得它迅速风靡一时。
我第一次感受到它那精妙绝伦、近乎震撼的威力,是在秋叶原一家商店的演示屏幕上。Voodoo流畅呈现的3D图像,其冲击力着实惊人。
Voodoo2
随后,3dfx 在 Voodoo2 上推广了“SLI”等功能,通过使用两张显卡进一步提高了性能,这在一些 3D 游戏爱好者中非常流行,以至于同时购买两张显卡变得司空见惯。
当时的主要竞争对手正是如今声名显赫的英伟达(NVIDIA)。他们的第一款视频芯片“NV1”以Diamond Multimedia的3D显卡“EDGE 3D”的形式发布,并因能够流畅运行捆绑软件“Virtua Fighter”而备受关注。然而,说实话,这款显卡并没有真正流行起来,我至今仍清晰地记得在秋叶原看到有人以极低的价格出售“Virtua Fighter”套装。这段经历让我很长一段时间都对英伟达抱有相当负面的印象。
3dfx凭借Voodoo2显卡逐渐流行起来,但在1998年左右,市场对能够同时处理2D和3D图形的单显卡的需求日益增长,而不再局限于专用的3D显卡。为了满足这一需求,3dfx推出了“Voodoo Banshee”,它拥有Voodoo2的3D性能,同时还能渲染2D图形,并迅速成为热门话题。与此同时,NVIDIA的2D/3D兼容显卡“RIVA 128”及其后续产品“RIVA TNT”也开始流行,“Voodoo vs RIVA”之争愈演愈烈。
EDGE 3D
RIVA 128
其他公司,如 ATI 的“Rage 128”、Matrox 的“Millennium G200”和 S3 的“Savage”,也都在发布具有 3D 功能的 2D/3D 显卡,这使得该市场竞争异常激烈。
大约在同一时期,我对视频采集也产生了兴趣。采集技术本身内容丰富,我就不赘述了,但我当时确实用过一款名为“All-in-Wonder 128”的一体式显卡,它搭载了ATI公司同期发布的“Rage 128”显卡芯片。这款芯片不仅可以作为显卡使用,还能通过专用软件实现视频采集功能。因此,Rage 128给我留下了深刻的印象。我还因此结识了不少有趣的人,甚至有人用Rage 128给孩子取名,这真是一段难忘的经历。
XPERT 99 搭配 Rage 128 VR
然而,3dfx决定在其下一代产品“Voodoo 3”中不再向其他公司提供其最新芯片,这导致其市场份额下滑。随后,由于微软的3D API“DirectX”与各种3D视频芯片的兼容性不断提升,3dfx最终被NVIDIA收购,其发展历程也随之结束。
与此同时,我对3D仍然毫无兴趣,所以当时我梦寐以求的显卡是“Number Nine Revolution IV”。它刚发布时我没能立刻入手,但我记得后来终于拿到手时,它那酷炫的外观着实让我印象深刻。我当时并没有测试它的3D性能,但不知为何,我感觉它的2D渲染效果和Millennium显卡一样出色,于是我用了一段时间。然而,Number Nine在3D性能方面最终败下阵来,1999年被S3收购,它在21世纪初的停产也被视为2D时代终结的象征。
Number Nine Revolution IV
之后,我使用了一段时间的 Millennium G200 和 Millennium G400,但说实话,它们并没有像我第一次接触 Millennium 时那样给我留下深刻的印象,从那时起,我的兴趣逐渐转移到了价格更低、集成显卡功能的芯片组上。
在这种背景下,Canopus 的“Spectra”系列显卡凭借其对“图像质量”的执着追求,展现了其独特的个性,可以说是当时独树一帜的潮流。它配备了许多独特的图像质量增强功能,例如专有的“巫医”(Witch Doctor)技术、通过独立电路板输出视频信号的“SSH(信号高速公路)”技术,以及可根据显示器特性进行调节的模拟信号滤波系统“DFS(双滤波系统)”技术。即使使用模拟连接,它也能呈现清晰锐利的图像,彻底消除屏幕模糊。虽然我当时并没有特别迷恋它,但我仍然记得它对细节的关注给我留下了深刻的印象。
我们之前一直没有真正谈到的一个重要因素是主板上的连接端口。到 Windows 95 发布时,PCI 和 ISA 总线已经成为台式电脑主板的标配。虽然过去也出现过 ISA 总线产品,但 PCI 总线速度更快,因此当时的大多数显卡都是基于 PCI 的。
转折点出现在1996年。如前所述,随着显卡的作用日益增强,包括3D处理,显卡需要专用总线来实现更快的传输速度。此时,英特尔开发了“AGP(加速图形端口)”并将其应用于主板。自此,AGP成为显卡的主流总线。
AGP是PCI的扩展,其重点在于传输速度。第一代AGP将传输速度提高了一倍,后续版本,例如“AGP 4X”和“AGP 8X”,则随着时代发展不断提升传输速度。
AGP标准推出后,曾作为主流标准使用了大约10年,但作为基于PCI的标准,其性能已达到瓶颈。因此,为了进一步提升速度,AGP过渡到了PCI Express,并沿用至今。PCI Express版本的传输速度逐年提升,预计在未来几年内仍将保持领先地位。
“ATI的红色电路板”与激烈的性能竞争
进入21世纪,显卡进入了一个纯粹追求性能的时代,重点在于“3D图形渲染的速度和质量”。市场逐渐被两大巨头主导:NVIDIA和ATI(现为AMD)。
即使在两大巨头并存的时代,NVIDIA 也始终保持领先地位,引领潮流。然而,2002 年发布的 GeForce FX 5800 就是一个因用力过猛而导致失败的例子。为了追求更高的可编程性和更精美的画面,这款显卡运行温度极高,需要高速风扇进行散热,噪音巨大,最终引发了诸多问题。后来,甚至公司高管都戏称它为“吹风机”,可见其过热程度之严重。
另一方面,同期发布的“RADEON 9700 PRO”性能高于“GeForce FX 5800”,但其发热量控制在可以用小型风扇散热的水平,使其能够巧妙地跻身显卡市场的顶端。
GeForce FX 5800
就我个人而言,我认为NVIDIA GeForce 256(首款采用“GPU”名称的显卡)和GeForce 3(首款面向消费级市场的可编程着色器架构)都非常出色。它们标志着GPU在程序化处理领域的应用转折点,使得在GPU上运行的程序化处理能够实现全新的3D图形表达方式。
后来,NVIDIA 在 GeForce 8 系列显卡中开始应用“CUDA”技术,使 GPU 能够执行与游戏无关的程序部分。令人惊叹的是,他们是如何将 GPU 处理原本由 CPU 完成的部分运算这一独特理念变为现实的,以及这项技术如何延续至今,并应用于人工智能学习和其他领域。
虽然当时我从未真正使用过 CUDA 进行编程,但我正在使用 Pegasys 的视频编码软件“TMPGEnc 4.0 XPress”,它具有 CUDA 编码功能,其高性能给我留下了深刻的印象,尤其是我当时正在进行视频编辑。
在高端“显卡”不断发展的同时,“芯片组集成显卡”也在经历着另一种变革。将视频功能集成到单个芯片中的概念,此前Cyrix公司曾通过“MediaGX”芯片提出,而英特尔则凭借1999年推出的“Intel 810 (i810)”芯片组将其推向了主流市场。
intel810
当时,i810处理器对于买不起独立显卡的学生和组装商用电脑的人来说简直是救星。然而,对于电脑发烧友来说,这也意味着要与一种名为“UMA(统一内存架构)”的棘手机制作斗争,因为UMA会占用一部分主内存作为显存。当时使用这款芯片组的用户肯定都愤愤不平,心想:“我只有64MB宝贵的内存,结果8MB都被显卡占用了!”
虽然英特尔i810芯片组凭借其可靠性而广受欢迎,但威盛和SIS芯片组也吸引了PC发烧友和预算型PC制造商的密切关注。特别是2000年前后推出的“威盛Apollo MVP4”和“SIS 630”,以及为Athlon处理器设计的“Apollo KT133”和“SIS 730”,它们几乎成了“一体化”芯片组的代名词,将从视频、音频到网络的所有功能集成到单个芯片中。
大约在那个时候,我对像“i810”这样的集成芯片组比对顶级显卡更感兴趣,而且我经常使用它们。它们最大的吸引力在于无需单独的显卡就能显示视频,所有功能都集成在一块主板上,这让我感到一种莫名的“怀旧”。
因此,他们也关注着代号为“Timna”的CPU,这款CPU是英特尔正在开发的,集成了视频功能。英特尔很早就开始尝试将GPU集成到CPU中,如今这已成为一种普遍现象,但这个项目最终并未发布,在CPU发展史上逐渐被人遗忘。
采矿风暴与人工智能个人电脑的崛起
自2010年代以来,GPU性能持续提升,大约在同一时期,GPU与当时最新家用游戏主机之间的差距开始缩小,甚至超越了后者。NVIDIA的“GeForce”系列显卡经历了多次迭代,产品名称从“GeForce XXXX(四位数字)”演变为“GeForce GTX XXX(三位数字)”,并持续发展为具备实时光线追踪功能的“GeForce RTX XXXX(四位数字)”系列,该系列至今仍在沿用。
随着NVIDIA的不断发展,AMD也在不断进化。为了应对这一挑战,AMD持续推出Radeon系列显卡,该系列从Radeon X发展到Radeon HD、Radeon R和Radeon RX。从Radeon RX 6000系列开始,AMD还支持实时光线追踪技术。
事实上,早在2012年,我就在玩《上古卷轴5:天际》这款开放世界动作角色扮演游戏,当时玩的不是PlayStation 3或Xbox 360等最新的家用游戏机,而是一台游戏笔记本电脑。到了2015年左右,为了从事游戏编剧的工作,我入手了第一张高端显卡——GeForce GTX 980,它那足以媲美当时家用游戏机的超高画质和性能让我惊艳不已。
我购买GeForce GTX 980时,最让我震惊的是它的价格。当时高端显卡的售价接近10万日元,但花这么多钱,你完全可以买到一台包含所有软件的高端家用游戏机。2015年,PlayStation 4上市,首发价格为39980日元(不含税)。当然,配备高端显卡的PC可以渲染出更精细的画面,但就性价比而言,游戏机更胜一筹。
随后,在2017年,GPU领域发生了一件大事:加密货币挖矿热潮。这是因为当时显卡(包括NVIDIA显卡)标配的“CUDA”等“通用图形处理器”(GPGPU)技术被认为是运行加密货币挖矿程序的理想选择。结果,显卡迅速从商店货架上消失,价格飞涨——这一景象至今仍历历在目。回顾当时的新闻,许多可以安装多张显卡的母板以及不带视频输出功能的专用挖矿显卡相继问世,从中可以感受到当时挖矿热潮的盛况。
由于新冠疫情带来的社会变革,2020年可以被视为游戏PC发展史上具有里程碑意义的一年。虽然疫情导致居家办公人数激增,例如因居家隔离令等社会因素而采取的远程办公措施,但游戏行业也迎来了诸多积极机遇,例如居家游戏玩家数量的增长。
尤其是在电子竞技领域,对游戏电脑的需求急剧增长,部分原因是环境变化,例如线下比赛从使用家用游戏机转向几乎完全使用游戏电脑的线上比赛。这导致游戏电脑厂商赞助职业玩家的趋势更加明显,而这一趋势很可能与新冠疫情的影响不无关系。
此后的几年里,游戏电脑的受欢迎程度持续不减,越来越多的家庭用游戏电脑取代家用游戏机,创造了前所未有的繁荣景象。
自2021年以来,我一直在报道由卡普空公司主办的职业格斗游戏联赛“街头霸王联赛”(Street Fighter League),该联赛使用格斗游戏系列“街头霸王”进行比赛。今年是一个转折点,因为这项赛事在2020年之前一直以线下形式举办,而今年是首次主要以线上形式进行。此外,联赛还引入了“战队所有者制度”,即公司成为战队所有者并组建战队,这一制度确立了沿用至今的比赛模式。
此外,人工智能日益增长的热度很可能是推动GPU普及的另一个因素。这一切始于2015年,当时人工智能程序“AlphaGo”击败了一位职业围棋选手。AlphaGo由谷歌旗下DeepMind开发,轻松颠覆了当时“人工智能很难战胜职业围棋选手”的普遍认知。AlphaGo所采用的“深度学习”技术的高效性表明,人工智能正以前所未有的速度发展。
随后,大约在2022年,一种名为“ChatGPT”的新型人工智能服务横空出世,展现出远超以往任何人工智能技术的性能。该服务发布后迅速普及,其影响力促使谷歌和微软等其他公司纷纷效仿,无疑使其成为当前人工智能热潮的先驱。由于GPU擅长并行处理,而并行处理恰好是此类人工智能学习过程的理想选择,因此对GPU的需求进一步增长。
由于人工智能的蓬勃发展,一场争夺人工智能内存资源的激烈竞争已经爆发。再加上前文提到的游戏PC的兴起以及当前紧张的全球局势,导致了一种复杂的局面:从2025年底开始,全球PC和智能手机市场将面临零部件供应的“寒冬”。这一趋势并未发生太大变化,因此未来走向难以预测。
顺便问一下,以前集成在芯片组中的GPU后来怎么样了?这种情况在2000年代末随着“酷睿i”系列的发布而发生了改变,这是英特尔的一个转折点,图形功能完全集成到了CPU芯片中。英特尔将GPU的代号定为“Clarkdale”,并在“Sandy Bridge”架构中展示了其完善后的版本。
自2011年起,AMD也开始发布集成GPU的CPU,并将其称为“APU(加速处理单元)”。随着两家公司都发布了集成GPU的CPU,似乎已经明确区分了配备高性能GPU的游戏PC和使用集成GPU的CPU的商用PC。
AMD的APU尤其引人注目,因为它们后来被应用于PlayStation 5家用游戏机。此外,Valve推出的Steam Deck便携式游戏PC也采用了类似的APU配置,这引发了便携式游戏PC市场的蓬勃发展,并在游戏PC行业开创了一个新的类别。这一突破进一步加速了AMD APU的研发,便携式游戏PC市场似乎正在步入一个新阶段。
30 年后的景象会是什么样子?
最后,让我们对30年后,也就是2056年GPU的发展状况做出一个现实的预测。未来,当硅芯片的微型化达到0.1纳米的原子级精度,物理极限被突破时,目前“排列多边形、着色、显示在屏幕上”的渲染方法将成为历史。
到2056年,GPU将不再是独立的电路板,而是集成在玻璃基板上“高密度3D堆叠”的芯片组的一部分。渲染将完全转向人工智能驱动的“神经渲染”。届时可能根本不需要显示器;取而代之的是,云端处理的图像将通过超低延迟的光互连网络直接传输到我们的视网膜上,呈现出“与现实难分彼此”的景象。
随着人工智能融入我们的日常生活,“物联网(AIoT,或更确切地说是万物人工智能)”变得司空见惯,人们主动使用“搜索”来获取信息的日子将不复存在。未来,诸如“那是什么来着?”之类的问题将由我们脑海中的人工智能来解答……这样的未来或许指日可待。
另一方面,即便如今个人电脑已广泛普及,仍然有人喜欢用自己心爱的文具进行手工工作。我猜想,未来肯定还会有个人电脑——专为那些特意选择使用手感舒适的键盘输入文字的人而设计的设备。
至此,我们对GPU三十年发展历程的回顾就结束了,此前我们对CPU的探讨也告一段落。遗憾的是,奠定GPU和图形加速器基础的3Dfx、S3和Number Nine公司已不复存在。然而,它们积累的技术仍然深深扎根于当今GPU的基础之中,正是由于它们的竞争,我们今天才能看到如此生动逼真、高清的计算机图形。
即使30年后,当设备形态发生改变,我们这些PC爱好者的后代仍然会讨论诸如“图像在视网膜上显示延迟的原因是XX公司的芯片”或“我不喜欢XX公司的AI处理”之类的问题。
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4424内容,欢迎关注。
加星标⭐️第一时间看推送
求推荐
热门跟贴