两台手机、一块平板、一台连独显都没有的老旧笔记本——四台设备竟然同时流畅跑着四个独立的PC游戏。

而驱动这一切的,是一块连视频输出接口都没有的“铁疙瘩”。

打开网易新闻 查看精彩图片

800元从二手市场捡回来的新华三XG310计算卡,正在用最不讲道理的方式改写“显卡”的定义。

一张服务器退役下来的计算卡,凭什么能在民用场景里玩出四路串流的操作?它到底是真香还是深坑?

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

四颗GPU焊在一块板上,32GB显存却只有一条乡间小道

这张XG310拿在手里沉甸甸的,全金属外壳包裹,单槽设计,长度约26厘米,标准四分之三长卡。

尾部一个8PIN供电接口,整卡满载功耗在150瓦上下——被动散热、无风扇、无显示接口,纯正的服务器血统。

拧下散热器,四个独立的GPU核心直接焊在板上,代号SG1。

打开网易新闻 查看精彩图片

这名字听着陌生,换一个说法就明白了——它跟英特尔当年试水市场的初代独显DG1底层架构完全一致,本质上都是第12代图形架构的产物。

每个核心96个执行单元,四个凑在一起就是384个EU,配上单核心8GB的LPDDR4x显存,整卡显存直接干到32GB。

打开网易新闻 查看精彩图片

核心堆得够猛,通信通道却寒酸得离谱。

这张卡插进服务器走的是PCIe 3.0 x16总线,表面上带宽充裕,一到底层就露馅了——四颗GPU的物理通道被全部卡死在PCIe 1.0 x1,折算下来单向带宽只有250MB/s左右。

凡是需要往显存里塞高清贴图的PC游戏,这点带宽瞬间就能被撑爆。

说白了一张豪华核心配残废带宽的硬件,生来就不是给游戏玩家准备的。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

腾讯当年采购的神器,凭什么让英特尔在云游戏赛道硬刚英伟达?

这事的根源得回到2020年。

2020年11月,英特尔正式对外发布了面向数据中心的服务器GPU,新华三基于此打造了XG310扩展卡。

每张卡搭载四颗服务器GPU,在一个双卡系统中即可支撑超过100个安卓云游戏并发用户,最高可扩展到160个。

打开网易新闻 查看精彩图片

这张卡的产品定位极其清晰:企业级安卓云游戏和高密度流媒体。

腾讯云游戏平台“仙游”是最早的一批客户之一。

腾讯仙游云游戏平台副总经理Allen Fang在英特尔的官方新闻稿中直接表态:“英特尔至强可扩展处理器和英特尔服务器GPU提供了高密度、低延迟、低功耗、低TCO的解决方案。我们在双卡服务器上能同时运行超过100个游戏实例,覆盖最热门的产品,包括《王者荣耀》和《传说对决》。”

打开网易新闻 查看精彩图片

2021年11月,腾讯云GPU云服务器正式上线渲染型GI1新机型,搭载的正是H3C XG310加速卡,单张卡包含4颗Intel SG1芯片,适用于安卓云游戏、安卓云应用和视频转码处理场景。

这张卡当年的官方售价19999元,面向企业客户,从来没打算让你跑PC游戏大作。

打开网易新闻 查看精彩图片

英特尔还专门拉了一张对比图,在同场景下H3C XG310的性能表现远优于NVIDIA T4。

大厂买回去的用法非常简单粗暴——用服务器同时跑几十个轻量级安卓系统,画面在GPU内部渲染完后直接压成低码率视频流推送出去。

安卓游戏的贴图本身体量就小,250MB/s的带宽绰绰有余。

可以说这张卡从设计阶段就注定跟“正经显卡”走的不是一条路。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

单卡四路串流的骚操作,绕过带宽封锁的核心理念只有一条

既然物理带宽卡脖子,Docker容器化串流成了唯一的破局点。

再调用SG1内置的QSV媒体引擎,用硬件编码压成几十兆码率的小体积视频流,通过网络推送到客户端。

Moonlight客户端负责接收解码,用户看到的是一路1080P 60帧的画面流,而不是一个“正在加载贴图”的幻灯片。

打开网易新闻 查看精彩图片

技术栈用的是Sunshine + Moonlight这一套成熟串流组合,搭配Docker容器实现多实例并行。

Sunshine作为自托管开源游戏串流服务器,支持Intel VAAPI硬件编码,能在任何装有Moonlight客户端的设备上实现低延迟游戏体验。

一口气跑四个带串流协议的原游戏容器,Moonlight分别连上各自的串流节点,一台服务器就变成了一个迷你网吧。

打开网易新闻 查看精彩图片

实测环节中,3D游戏如《极乐迪斯科》中高画质下能跑到30至40帧,大部分2D游戏基本完美60帧流畅运行。

不过因为X86游戏在Linux下走的是Proton转换层运行,加上SG1本身就是极其小众的GPU核心,部分游戏会出现花屏等兼容性问题。

部署过程也踩了不少坑——XG310没有物理显示输出接口,直接套用原版容器可能出现无法连接、操作串扰等情况,需要借助AI对原版容器进行修改适配才能跑通。

打开网易新闻 查看精彩图片

折腾完游戏再来看老本行。

这张卡真正的舒适区是影音串流和高密度转码。

单个SG1核心在Jellyfin里已经能轻松处理5到6条高码率4K视频的硬件转码,XG310上了四颗核心,完全可以跑四个Jellyfin容器实现四倍转码能力。

或者同时创建四个HandBrake容器对视频素材批量预处理。

唯独有个遗憾——受限于11代底层架构,SG1的媒体引擎只支持AV1解码,不支持AV1硬件编码。

没法用这个格式进行更高效的转码推流,算是一处美中不足的硬伤。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

这块卡到底值不值?劝退的建议比点赞更实在

800元淘一张XG310回来玩,结论得看对象。

对绝大多数普通用户来说,这玩意纯粹是看个热闹。

真要玩3A游戏,11代核显的底子本身就差一截,SG1的性能大致也就GTX 750到GTX 950之间的水平。

现实生活中极少出现“四个人同时挤在一台服务器上串流打游戏”的需求,家庭NAS的编解码需求一张一两百元的DG1独显或者直接用处理器核显已经绰绰有余,用不上四个核心的算力。

打开网易新闻 查看精彩图片

折腾门槛也是一道硬坎:需要单独接8PIN供电,需要自己改造风道做散热——被动散热的火炉如果没有服务器风道压着,温度轻松突破95℃开始降频;

还需要手动修改系统GRUB启动参数强制识别驱动;容器部署过程的适配和调试更是对Linux基础有要求。

至于32GB显存能不能跑AI炼丹——核心算力太弱,显存带宽也慢,这条路基本走不通。

打开网易新闻 查看精彩图片

真正适合它的人群,只有那些有技术基础、就图个折腾验证的硬核玩家。

普通人把这800元留着吃顿好的,那才叫真香。

折腾的意义从来不在于性价比,而在于证明一条看似走不通的路其实能走通。

这张XG310用最不正经的方式干了一件正经事,光是“单卡四路串流PC游戏”这个行为本身,就已经够值回票价——当然,是对该折腾的人而言。