打开网易新闻 查看精彩图片

4K 电视塞进眼睛是什么体验?Vision Pro 用户可能最有发言权——单眼像素超过 4K 电视,双眼合计 2300 万像素,现有渲染技术在这块屏幕上跑起来,跟让老爷车拉集装箱差不多。

苹果研究团队联合香港大学最近交了一份答卷,叫 LGTM(Less Gaussians, Texture More)。名字听着像程序员自嘲,实际是个"分工偷懒"的聪明办法。

当前主流的 3D 高斯泼溅技术有个老毛病:分辨率越高,算力需求越呈指数级膨胀。就像你请一位画家画壁画,画得越大,他越得把每一笔都放大到同等精度,最后累瘫在脚手架上。

LGTM 的做法是拆活。第一步让模型从低分辨率图像里把场景结构摸清楚,保证几何框架在 2K 或 4K 下不垮;第二步另请一个网络专门"贴皮肤",把高分辨率纹理精准糊到几何骨架上。几何简单,纹理叠加,各干各的,避免了全链路硬扛高算力。

演示效果上,纹理细节和文字清晰度都有明显提升,画面已非常接近真实原图。对 Vision Pro 用户来说,这意味着虚拟环境和透视体验的卡顿、模糊问题有望缓解。

技术团队给论文起的标题直译过来是"少点高斯,多点纹理"——听起来像减肥食谱,实则是给算力密集型设备的一条生路。