企业级GPU市场一直被超大规模数据中心牵着走,但超大规模客户之外的普通企业,手里攥着AI预算却买不到合适的算力设备。AMD本周在戴尔技术世界2026大会上投下了一枚新炸弹——Instinct MI350P,一张功耗仅450瓦的PCIe标准接口加速卡,直接瞄准了那些不想改造机房、不想养博士团队的传统企业。

这张卡最大的特征不是跑分有多暴力,而是部署门槛低得不像是数据中心的硬件。450瓦的功耗稳稳落在标准风冷服务器的供电范围内,不需要液冷改造,不需要重新拉电缆。AMD数据中心GPU业务发展高级经理Mike Darby在大会上说了句很直白的话:主流服务器直接插上就能用。

打开网易新闻 查看精彩图片

显存配置是另一个让推理场景兴奋的点。MI350P塞进了144GB的HBM3E高带宽内存,Darby对这个设计给出的解释很务实——推理业务的核心体验指标是“首令牌延迟”,也就是用户发出一条指令后,模型吐出第一个字需要等多久。等待时间超过几秒,用户的注意力就跑了。大容量高带宽内存的作用,就是让模型能在显存里放下更多参数,首字响应速度压到体感可接受的范围。

硬件参数好看是一回事,企业IT部门买回去能不能跑起来是另一回事。AMD这次同步放出了ROCm 7软件栈和AMD推理微服务,两个组件组合起来解决的是同一个老问题:GPU部署需要的那层“胶水代码”和调优工作,过去得靠博士级的人才撑着。Darby的描述很形象——开机、启动推理微服务,主流开源模型的开箱性能直接拉满,不需要计算机博士学位也能搞定。

更降低决策心理门槛的一个操作藏在戴尔的客户解决方案中心里。戴尔已经把搭载MI350P的XE9785和XE9785L服务器部署在中心机房,企业现在就可以申请远程概念验证测试。Darby的原话是:“你不需要买一台巨大的服务器来试用并证明它有效,戴尔已经有现成的环境可以立即远程接入。”从采购决策角度看,这意味着企业在签采购单之前,能用自己的业务负载跑一遍真实数据,而不是靠厂商的白皮书去赌性能。

这条产品线释放的信号相当清晰:AI算力市场的下一波增量,不在那几家超大规模云厂商的定制化采购里,而在数百万家有算力需求但缺乏专属基础设施团队的传统企业。谁能把部署复杂度打下来,谁就能吃到这块长期以来“看得见吃不着”的蛋糕。AMD用风冷PCIe形态加上预优化的软件堆栈,正在把答案摆到桌面上。