过去几年里,关于“三维世界”的想象几乎都围绕着头显展开。从 Vision Pro 到各种 AR 眼镜,人们似乎已经默认,想要获得沉浸式三维体验,就必须依靠头戴式设备。
但其实还存在另一条更简单的路线:裸眼 3D 显示。顾名思义,就是只用双眼看,就能直接获得具有深度感的三维视觉体验。我们已经能在一些生活场景中见到它:商场外墙上那些仿佛从屏幕里探出来的巨型熊猫;博物馆里用于展示文物的三维数字展项;以及一些无需佩戴眼镜就能观看立体影像的展示设备……
不过,今天的裸眼 3D 还没有成为主流的三维显示方式。一个重要原因是,现有系统往往只能在有限视角内提供理想观看效果。观众一旦偏离最佳位置,立体感就会迅速下降;而那些能够跟踪用户位置、提供高质量显示效果的方案,又很难同时支持多人自由观看。
针对这个问题,近日,清华大学戴琼海、吴嘉敏团队在 Nature Photonics 发表最新研究,提出一种名为“超斯涅尔扫描光场显示(SSS-LiD)”的新方案。研究团队在 150°超宽视角下实现了高分辨率裸眼 3D 显示。实验结果显示,相比具有代表性的商业光场显示产品,其观看视角提升接近 3 倍,在整个观看范围内的有效分辨率提升 2 倍以上。
不可兼得的视角与分辨率
裸眼三维显示有着多种不同的技术路线。常见的例如全息显示、体显示和空中成像等。但在这些之外,还有一条被认为最有潜力支持“多人同时观看”的方案:光场显示。这也是戴琼海团队的选择。
与普通显示器向所有观众显示同一幅画面不同,光场显示会主动控制光线传播的方向,让来自不同方向的观察者接收到略有差异的图像信息。当人眼接收到这些具有视差的光线时,大脑便会感知到深度,从而形成真实的三维效果。
然而,这种优势也带来了新的挑战。为了让更多角度的观众都能看到正确的三维画面,系统必须向空间中的不同方向同时投射大量光线。随着观看视角不断扩大,需要生成和分配的视图数量也会随之增加,而显示系统能够承载的信息量却是有限的。
这样造成的结果就是:视角越宽,每个视角能够获得的信息越少,画面细节就越容易被摊薄,分辨率随之下降。
团队在进入这一方向时便意识到,这个矛盾必须被解决,否则裸眼 3D 很难真正走向实用化。“我们最开始是从信息量的角度思考这个问题。”本次论文的第一作者、清华大学陈一帆博士说。
团队认为,视角和分辨率本质上都受到系统总信息量的限制。除了信息量本身,他们还发现另一个重要瓶颈:串扰。所谓串扰,可以理解为不同视角之间的信息互相干扰。即使系统本身拥有足够的信息量,如果这些信息无法被有效利用,最终呈现出来的显示效果依然会大打折扣。
因此,如何提高信息利用效率、降低串扰,成为团队研究过程中的另一条主线。
一次偶然观察带来的灵感
在寻找解决方法的过程中,团队早期曾尝试过超表面、透镜优化等多种路线,希望降低不同视角之间的串扰。在一次实验中,研究人员从侧面观察柱透镜结构时,意外发现如果将结构反向放置,可视角似乎会明显增大。
最初,他们并不完全理解这一现象背后的原因。后来经过大量资料查阅和理论分析,团队才意识到,它与“斯涅尔窗口”(Snell's Window)所体现的折射规律存在相似机制。
斯涅尔窗口,是指潜水者从水下仰望水面时,原本覆盖整个半球的天空会因为水和空气界面的折射,被压缩进一个明亮的圆形窗口之中。自然界是在把大范围光线压缩进一个有限窗口,而团队希望实现的则恰恰相反。他们想要通过重新设计光学结构,将有限范围内的显示光线展开到更大的观看角度。
“这看起来像一个偶然出现的灵感,但实际上经历了很多轮工程迭代。”陈一帆说。
沿着这一思路,团队多次试验,最终设计出超斯涅尔柱透镜阵列(SS-LLA)。传统柱透镜阵列受几何光路和孔径采样关系限制,如果想获得 150°这样的超宽视角,往往需要极大的面板尺寸,系统体积和采样损失都会迅速增加。
SS-LLA 则通过两次连续折射重新分配光线路径,将原本约 52°的投射范围扩展到 150°。与此同时,团队还通过透镜结构和孔径位置的联合设计,降低大视角条件下的像差和串扰,使不同视角之间尽可能保持独立。简单来说,这套结构负责把光线送得更广,同时尽量避免边缘视角变得模糊。
不过,当视角被成功扩展之后,前面提到的信息量的问题随之浮现。光线被分配到更大的空间范围后,每个角度能够获得的采样信息也会相应减少。“这个 trade-off 本身是由信息量决定的,不可能凭空消失。”陈一帆告诉我们。
于是他们决定引入第三个维度——时间。
把时间变成分辨率
研究团队提出了整体机械扫描方法(HMS)。
与传统只移动透镜的扫描方式不同,HMS 将显示屏和超斯涅尔柱透镜阵列固定为一个整体,再让整个显示模块高速横向扫描。
与此同时,显示内容同步刷新,人眼则利用视觉暂留效应,将不同时间获得的图像自然叠加起来。从结果上看,相当于同一块屏幕在多个时间点提供不同采样信息,再通过时间复用补充空间分辨率。这于团队之前在成像领域所提出的扫描光场成像有异曲同工之妙。
换句话说,团队没有试图在固定的信息量条件下强行突破空间限制,而是把时间也纳入信息系统之中,在更高维度上提高整体信息通量。
这种设计还有一个额外优势。在传统只移动透镜的扫描方案中,极小的同步误差都可能导致三维场景发生明显扭曲。而在 HMS 中,同样的误差更多表现为轻微平移,对最终观看效果影响更小,因此系统稳定性也得到提升。
基于 SS-LLA 和 HMS 两项核心设计,团队搭建了完整的 SSS-LiD 原型系统。系统采用一块 1080×1920 分辨率、360Hz 刷新率的显示面板,并配合定制超斯涅尔柱透镜阵列进行整体扫描。实验结果显示,该系统能够在 150°超宽视角范围内实现接近 480p 的裸眼 3D 显示效果。
具体来看,HMS 使系统水平方向空间分辨率最高提升约 8 倍,垂直方向最高提升约 3.2 倍。同时,系统在整个 150°观看范围内保持较低串扰,并能够维持连续运动视差和正确空间遮挡关系。
研究团队还将其与当前商业光场显示领域具有代表性的 Looking Glass 32 英寸显示器进行了对比。在输入像素数量统一的条件下,SSS-LiD 的观看视角约为商业方案的 3 倍;在整个观看范围内,水平和垂直方向有效分辨率提升约 2 至 2.5 倍,同时表现出更少伪影和更高的细节清晰度。
当 AI 开始生成三维世界
在不少人看来,随着 VR 和 AR 设备不断成熟,裸眼 3D 似乎已经不再是最热门的技术方向。而在陈一帆看来,AI 的发展让三维显示的价值重新被凸显。
他告诉 DeepTech,三维显示本质上是一种人机交互方式,而完整的人机交互系统既包括前端显示设备,也包括后端内容生产能力。过去很长一段时间里,三维内容制作成本高、周期长,内容供给本身就是行业发展的瓶颈,因此显示技术的重要性并没有充分体现出来。
但生成式 AI 的出现正在改变这一局面。无论是三维建模、数字内容创作,还是空间场景生成,AI 都在快速降低内容生产门槛。过去需要专业团队耗费数周甚至数月制作的三维内容,如今越来越多能够通过算法自动生成。“以前的问题是没有内容,现在的问题反而是内容越来越多,但显示端跟不上了。”陈一帆说。
在他看来,AI 正在以前所未有的速度提升后端内容生成能力,而显示设备依然受制于视角、分辨率和观看人数等问题。随着后端能力快速进步,显示反而开始成为新的瓶颈。这也是团队重新投入裸眼 3D 研究的重要原因之一。
三维显示时代还有多远?
可当 AI 正在加速创造三维世界,另一个问题也随之而来,显示技术真的已经准备好落地了吗?
对于这项技术的商业化前景,团队的态度很明确。“我们最终的研究方向一定是要把这项技术推向真正的应用,而不是停留在实验室里展示或者发论文。”陈一帆说。
不过,尽管论文展示了领先于现有商业产品的性能指标,研究团队并不认为这已经是一套成熟产品。目前的系统仍然是一套实验室原型机。加工精度、小型化、长期稳定性以及成本控制,都仍然需要进一步优化。
但陈一帆也认为,裸眼 3D 未来未必需要首先进入每个人的桌面。相比个人显示设备,团队更看好多人共享场景,例如教育、展览、文化遗产展示以及工业可视化等领域。原因很简单:与强调个人沉浸感的头显不同,光场显示最大的优势之一恰恰是共享。
“VR 更像是把人带进虚拟世界,而裸眼 3D 是在把虚拟世界带到现实世界里。”他说。在课堂上,学生可以围绕同一个三维模型进行观察和讨论;在博物馆里,观众无需佩戴设备便能够从不同角度观看数字文物;在展览和公共空间中,多个人也可以同时分享同一个三维场景。这种多人共享能力,恰恰是许多头显设备难以提供的体验。
在团队的设想中,理想的三维显示产品应当能够将三维内容生产、显示硬件和用户交互真正连接起来,让三维信息像今天的视频和图片一样自然地进入日常生活。而在那之前,裸眼 3D 仍然需要跨想要获得沉浸式三维体验越工程化、成本和生态建设等一系列现实门槛。
运营/排版:何晨龙
注:封面/首图由 AI 辅助生成
热门跟贴