现在高斯泼溅这个技术已经很火,不管是虚拟场景复刻、数字孪生还是三维建模,基本都绕不开这项技术。
但一直以来有个老大难问题始终没被彻底解决,那就是现实里随处可见的半透明材质,像汽车车窗、玻璃幕墙、塑料薄膜这类东西,表面同时存在清晰反光和背后透光效果。
而北京大学的AI研究团队提出了一个重磅框架RT-Splatting,专门来解决这两大难题。
咱们先说说传统技术到底卡在哪。原生的三维高斯泼溅把整个场景拆成无数粒子,靠透明度参数做颜色混合渲染,一碰上半透明镜面材质就彻底歇菜。
你想还原高光亮面的反光细节,模型就喜欢在物体后面瞎生成一堆漂浮的噪点伪影,不仅扭曲了反光本身,还把本该透过去看到的背景挡得严严实实。
后来业内也搞出不少改良方案,比如用延迟渲染思路先把各种属性存下来再着色,可它天生跟不透明物体更搭,处理透明材质只能抓到最表面那一层,透射光线根本叠不上去。
还有方案把透明物体和背景拆开重建,但要是隔着车窗看车内,这套方法直接翻车。
底层架构全面革新
北大研究团队就是看准了这些通病才另辟蹊径,RT-Splatting的核心思路其实挺好懂。不再用一个参数笼统定义粒子的透明属性,而是把几何存在感和光学通透感彻底拆开。
简单来说就是给每个微小渲染粒子发个双重身份证,既能当实体表面承接反光,又能做通透介质放过背景光线。
最核心的就是占用度与透明度解耦设计。传统方法只用一个透明度参数同时决定物体的实体感和光线通透度,这简直就是左右为难。
调高透明度能做出清晰反光,但玻璃就变不透明了;调低透明度倒是透光了,表面反光又糊成一团。
RT-Splatting直接把这个参数一分为二,一个是几何占用度,数值越高表面存在感越强,捕捉镜面反光细节就越精准。
另一个是光学透明度,专门管光线能不能穿过,数值越低材质越通透。
这就好比给玻璃立了个规矩,几何上它是完整实心表面能满足反光需求,光学上又是高通透状态绝不遮挡背后景物,完美解决了两头不讨好的毛病。
双管齐下的混合渲染
顺着这个基础,全新的混合渲染流水线也就水到渠成了,分成延迟渲染和前向体素渲染两条支路。
延迟渲染支路专门对付表面高频镜面反光,把法线材质这些关键属性缓存下来,再通过着色函数算出环境反光效果。
考虑到彩色玻璃这种自带底色的材质,研究团队还给粒子加了内部散射颜色和透射率属性,让玻璃不再是一张单调的透明薄片。
前向体素渲染支路则专心累积背景透射光线,让背景光线顺当穿过半透明表面。之后把反光和透射效果融合时,还加入一个可学习的衰减因子来模拟人眼真实感受。
强光高光区域会自然弱化背后景物,微弱反光下背景细节又能清晰显现,这点真是神来之笔。
不过反光和透射一起训练时特别容易发生梯度混淆,模型容易凭空生成多余噪点把背景弄脏。
研究团队为此独创了感知镜面的梯度门控机制,通过计算局部反光画面的色彩方差,判断当前像素是不是属于复杂镜面区域,再生成一个门控权重。
实测数据
为来测试RT-Splatting性能,研究团队在八个真实场景数据集上做了全面测试。
从量化数据看,RT-Splatting在整张画面和透明区域的所有指标上全面领跑。公开场景测试里透明区域峰值信噪比达到39.765,结构相似度0.992,甩开第二名一大截。
自采集实拍场景同样是断层领先。更难得的是模型还能保持每秒33帧左右的实时渲染速度,训练耗时仅0.9小时,画质精度、实时性能和训练效率全顾上了。
直观感受差距更明显,传统算法要么反光边缘模糊发虚丢细节,要么干脆把玻璃渲染成不透明。
而RT-Splatting出的画面车窗反光纹路清晰锐利,同时透过车窗能清楚看到车内结构,反光和透射双向拉满的效果确实惊艳。
研究团队做的消融实验也证明每一个模块都缺一不可,组合在一起才撑起整套方法的超高表现力。
让人惊喜的是这套解耦表达天然支持灵活的场景编辑,算是意外收获。研究人员可以直接单独调整半透明表面的粗糙度和通透程度。
一键去掉镜面反光,或者给玻璃上色改成茶色贴膜,不用重新重建场景,在虚拟布景和影视后期里有极大落地空间。
想系统掌握AI核心技能、获取行业认可资质?
CAIE注册人工智能工程师认证
助你拓宽职业赛道,成为AI领域持证实力派
企业、高校及渠道合作
热门跟贴