6月1日,英伟达CEO黄仁勋在台北GTC大会上宣布,公司正式进军个人电脑处理器市场。这次英伟达拿出的不是GPU老本行,而是个人电脑的“大脑”——CPU。消息甫一落地,华尔街的资金就像潮水一样涌了进来。截至当日收盘,英伟达股价涨超6%,市值单日膨胀3190亿美元;同为Arm阵营的Arm公司大涨超17%。跷跷板的另一头,高通跌近9%,英特尔跌超4%。资本用价格给出了最直接的判断:x86统治PC四十年的铁幕,第一次出现了真正意义上的挑战者。
这一脚踩进去的市场盘子很大。根据Gartner的预测,2026年全球AI PC出货量将达1.43亿台,渗透率约55%。所谓AI PC,指的是配备专用AI加速芯片(NPU或GPU)的个人电脑。这不是给极客准备的小众赛道,而是一个每年过亿台的换机市场。问题的核心,早已不是“要不要做”,而是“谁来做,以及怎么做”。
英伟达拿出的武器,叫做RTX Spark。这款芯片不是英伟达关起门来单干的产物。它的CPU部分,代号N1X,由英伟达与联发科联合定制设计,采用20核ARM v9.2架构——10个大核加10个能效核,配备32MB三级缓存,由台积电3nm制程打造。GPU部分则搬出了Blackwell架构,塞进了6,144个CUDA核心和第五代Tensor Core,性能直接对标RTX 5070移动版。CPU与GPU之间,通过NVLink-C2C芯片间互连技术融合,带宽高达600GB/s。作为参照,传统PC里CPU与GPU通信的PCIe 5.0 x16总线,带宽约64GB/s。两者共享128GB统一内存。这套规格表里藏着一个野心勃勃的信号。英伟达官方信息显示,搭载RTX Spark的设备将于2026年秋季上市,首发形态包括轻薄笔记本和紧凑型台式机。已公布的合作OEM名单里,戴尔、惠普、联想、华硕、微星赫然在列,预计将有超过30款笔记本和10款台式机同步上市。从一开始,RTX Spark瞄准的就是主流高端PC市场,而不是圈在小众开发者角落里的玩具。
英伟达还专门为它打造了一套功耗与散热管理框架,名叫MPTF,主打高负载下的低温和能效优先。这透露出一个姿态:英伟达对移动场景的功耗问题并非毫无准备。不过,具体的功耗数据、降频阈值、长时间AI推理的稳定性,目前仍然是一团迷雾。标签是贴出来了,但真功夫还得等机器到手再看。
AI算力是RTX Spark最耀眼的那张牌。1 Petaflop。这个数字让人炫目,但它必须被拆开来看。这个峰值性能跑在FP4精度下,一种专门为生成式AI推理设计的极致压缩格式。在通用计算、专业设计、办公软件里,FP4完全用不上。而传统x86 PC宣传的“10到50 TOPS”,指的是INT8精度下的NPU算力,兼顾AI加速与通用兼容性。两者不是同一把尺子,不存在同台竞技的基础。如果把度量衡厘清,在FP4精度、128GB统一内存的配置下,RTX Spark可以本地微调70B至700B参数的大模型,推理最高支持200B至2,000B参数模型。这是x86笔记本完全做不到的事。需要说明的是,RTX Spark内部没有独立的NPU,其AI加速完全依赖GPU的Tensor Core。1 Petaflop FP4大约等于500 TOPS(按FP8换算),是当前主流NPU的10倍以上。普通读者如果只盯着“1 Petaflop对50 TOPS”的数字对比,很容易被误导。
统一内存架构的核心价值,在于CPU和GPU共享同一个内存池,不再需要把数据从一边搬到另一边,从而减免了搬运带来的延迟和功耗。128GB对CPU来说是海量,但对大规模训练场景依然显得局促。相比之下,NVIDIA H100专业卡配备的是80GB HBM3。但RTX Spark的目标负载是本地推理和轻量级微调,128GB是一个务实的选择。NVLink-C2C的600GB/s,是一个芯片间互连的理论峰值,实际内存访问带宽大约落在273GB/s到300GB/s之间。作为参照,苹果M5 Pro的内存带宽为410GB/s,M5 Max可达820GB/s。统一内存最终能交出怎样的性能答卷,取决于缓存一致性协议的实现效率。而英伟达,尚未披露这一细节。
真正的护城河,不在硬件参数的对比表里,而在软件栈上。RTX Spark的核心优势不是“CPU加GPU”这样简单的加法,而是全栈CUDA支持、Windows深度适配以及128GB统一内存。对开发者来说,能在一台笔记本上无缝跑通CUDA生态,才是真正的痛点所在。英伟达在软件生态上构筑的绑定关系,远比一颗芯片的晶体管数量更难撼动。而性能对比,也不能只盯着M3 Max。Geekbench 6测试中,RTX Spark的单核成绩是3,096,多核18,837。苹果M3 Max(14核)的得分大约在3,124和18,920。这两组数字几乎贴在一起。但苹果在2026年3月已经释放出了M5系列芯片。第三方基准测试显示,M5 Max的早期样本Geekbench 6单核跑分高达4,268,多核29,233。需要提醒的是,早期跑分可能随最终产品调优而波动,仅能做趋势参考。拿2026年秋季上市的RTX Spark,去对比对手半年前的产品,会低估苹果的实力。此外,x86阵营的英特尔酷睿Ultra 200系列和AMD Ryzen AI HX系列,在游戏兼容性、工业软件、外设驱动上积攒的优势,仍然是Arm架构短期内无法跨越的壁垒。
在深入分析生态之前,有必要回顾一下RTX Spark的前身:DGX Spark。2025年10月,传奇程序员约翰·卡马克公开指出了DGX Spark的三大问题:功耗虚标——实际100瓦,标称却是240瓦;性能缩水;以及稳定性缺陷。这属于卡马克的个人测试,可能与官方实验室条件下的数据存在差异。DGX Spark是桌面AI计算机,RTX Spark是PC处理器,两者定位不同,CPU架构也不一样。但一条共同的基因——统一内存架构——把两者连在了一起。DGX Spark暴露出来的问题,可能预示着统一内存在消费级产品中的工程挑战。这是评估RTX Spark能否把纸面性能兑现到真实世界时,一个绕不开的参照。
回到2012年,微软曾与ARM合作推出Windows RT,要求所有软件必须重新编译为ARM版本。那次尝试失败的核心原因,在于微软自身的战略摇摆、OEM厂商缺乏动力、开发者看不到收益,以及当时ARM的性能孱弱。今天的环境已经发生了根本性的翻转。技术层面,Windows 11 on Arm加入了x86模拟层;微软在持续优化模拟性能,并联合厂商适配专业软件。市场层面,高通骁龙X Elite已经在Windows on Arm的高端轻薄本中落地,拥有量产机型和真实用户反馈。需求层面,AI开发者对本地大模型算力的饥渴,是十年前不曾存在的新刚需。不过,业内的普遍判断是,不同场景的迁移阻力差异显著。根据AMD委托Enterprise Strategy Group在2025年9月发布的一份调研报告,77%的企业反映将x86软件移植到Arm需要大量改造工作;82%的企业曾将部分工作负载从Arm迁回x86。需要指出的是,这份报告由x86阵营的AMD发起,立场需审慎对待,而且它没有按场景拆分,把工业软件和AI开发混为一谈,真实阻力必须结合具体场景独立判断。游戏,是x86生态最坚固的壁垒之一。好消息是,头部厂商正在破冰。拳头游戏已宣布《英雄联盟》和《无畏契约》将原生登陆该平台,KRAFTON的《PUBG》也已进入兼容库。微软的Prism模拟器已支持AVX与AVX2指令,解决了大量现代游戏的启动问题。微软官方表示,超过85%的Xbox Game Pass目录已经兼容Arm版Windows。但挑战依然存在。
热门跟贴