AMD最新发布的Ryzen AI Max 400系列有个数字相当刺眼:192GB统一内存,塞进一颗能放进迷你主机的芯片里。
对执着于本地跑大模型的人来说,这个数字意味着一件事——终于不用跟显存瓶颈死磕了。
【代号"Gorgon Halo"的芯片,到底变了什么】
架构层面几乎原封不动。Zen 5 CPU、RDNA 3.5核显、XDNA 2神经网络引擎,全部沿用上一代设计。唯一看得见的升级是旗舰款Ryzen AI Max+ Pro 495的频率:boost上限从5.1 GHz提到5.2 GHz,涨了100 MHz。中低端的Pro 490和Pro 485维持在5 GHz,频率这块没变化。
真正的区别藏在内存控制器里。上一代Strix Halo封顶128GB,Gorgon Halo直接拉到192GB。除此之外,两颗芯片像是同一个模子刻出来的。
【192GB统一内存,谁真的需要】
答案是:本地跑大语言模型的人,而且得是特定场景。
AMD给Gorgon Halo定了一个很具体的卖点——首款能在设备端独立运行300B+参数模型的x86芯片。为了撑住这个说法,192GB内存里有160GB可以划给显存用。
这个数字的含金量在于:原本需要云服务器或者多张高端显卡才能跑的模型,现在一台迷你主机就能搞定。AMD算过一笔账,按token消耗折算,单台设备每月能省下约750美元的云API调用成本。
但"token经济"的算盘有个前提——你得先拿到机器。
【时间线比参数更残酷】
华硕、惠普、联想的OEM系统要等到2026年第三季度。搭载上一代Strix Halo的Ryzen AI Halo整机倒是快一些,6月开启预售,定价3999美元。
Gorgon Halo的整机?目前还没有确认的发售日期。
更麻烦的是供应链。全球内存供应紧张已经迫使苹果撤下了高配置版Mac Studio的订单,AMD的192GB野心能否大规模交付,要打上一个问号。
对急需本地算力的研究团队或小企业来说,这份等待清单可能比参数表更难消化。
热门跟贴