智能眼镜既然都戴在脸上了,产品的核心就在于能跟人类一样看到物理世界。然而,目前的AI智能眼镜(如Ray-Ban Meta)大多只通过RGB摄像头让大模型看到画面。
问题是RGB画面缺乏绝对的物理尺度。大模型知道画面里有一个杯子,但无法判断杯子距离用户是30厘米还是80厘米。
此时,如果纯靠视觉算法去反推空间深度,需要持续压榨NPU或GPU的算力,这对于电池容量只有一两百毫安时的智能眼镜来说,后果可能是毁灭性的。
那么,假以时日纯视觉(CV)算法是否完全能替代深度传感器呢?代码真的能驾驭物理规律吗?
我们举个例子,如果一台头显被砍掉了dToF(直接飞行时间)激光雷达,然后被拿进暗光卧室或者毫无特征的白墙房间,纯视觉方案效果如何呢?实际上纯视觉方案最拿手的空间网格(Mesh)大概率会抓瞎,因为头显失去了绝对的三维物理尺度,本质上是在猜距离,而不是测量。
所以,物理世界的问题终归要用物理器件来解决。不过,要想让头显和眼镜具备准确的物理测量功能,也不是掏钱怼料那么简单。研发团队需要在几毫米的封装内压住发射端纳秒级的发热,并把整体功耗死死锁在毫瓦级,实操的难度极大。
面对这道颇具撕裂感的难题,目前XR领域的两大代表性巨头给出了两套逻辑不同的解法。然而对于中国的厂商,恕我直言不讳:学谁都不行,必须走第三条路。
空间计算玩法:富人 vs 穷人
当前,在空间网格划分(Mesh)和深度感知上,全球XR硬件巨头貌似走向了两个极端阵营。在旁观者看来,这场路线之争的本质就是BOM(物料清单)成本的战争。
阵营一:苹果的“富贵打法”(dToF路线)
从iPad Pro到Apple Vision Pro,苹果依靠强大的供应链掌控力和产品溢价,坚定不移地走 dToF(直接飞行时间)路线。这套方案通过发射极短的激光脉冲,计算光子往返的时间差,从而获得绝对的三维物理坐标。
为了支撑这套系统,苹果找索尼定制了昂贵的SPAD(单光子雪崩二极管)阵列。毫无疑问,这种“富贵打法”带来的物理体验是碾压级的:无论是在纹理极其单一的白墙前,还是在全黑的卧室里,Vision Pro的手势追踪和空间定位依然稳如磐石,几乎不存在丢失深度的可能。
阵营二:Meta的“穷人打法”(纯视觉/双目RGB路线)
与之形成鲜明对比的是行业领头羊Meta。为了死守Quest 3 最终 499美元的C端零售价,Meta的硬件团队在产品定型前,挥刀砍掉了原本计划搭载的深度传感器。取而代之的是纯靠两颗高分辨率RGB摄像头,辅以CV(计算机视觉)算法来“猜”深度。
如果观察一下物料清单,外界会发现Meta这套打法能省下大约二三十美金的BOM成本,但代价就是纯视觉方案在暗光环境下直接抓瞎;面对没有特征点的纯色桌面,深度估算会发生严重漂移;当两只手快速交叠时,边缘像素的扭曲肉眼可见。视觉算法算的是概率,而激光雷达测的是物理距离。
与此同时,国内众多渴望冲击高端的XR整机厂商,也处于一定的焦虑之中:他们想拥有苹果级别的空间精度,但兜里的硬件预算却不在一个量级上。怎么办呢?
第三条路的底层支撑:那些国产隐形英雄们
在这场BOM成本的博弈中,真正能够打破索尼、Lumentum等海外大厂价格垄断,把微型雷达从“选配”变成“标配”的,是一批长期蛰伏在消费电子底层的国产光电芯片隐形英雄。
好像之前从来没人专门讲过他们,今天我就挨个点名吧。由于笔者见识有限,可能也不全,欢迎大家在评论区批评补充指正。
如果仔细观察XR世界微型dToF架构,会发现其核心由发射端(TX)、接收端(RX)和光学微结构组成。
1. 发射端:VCSEL芯片
XR设备的dToF发射端必须使用 VCSEL(垂直腔面发射激光器)。它的难点在于,要在极小的die(裸片)面积内,实现极高的峰值功率密度和纳秒级的极速开关响应。同时,光电转换效率(PCE)必须极高,否则浪费的电能会全部转化为热能,直接把周围的树脂镜片烤化。
在这个环节,国内的纵慧芯光(Vertilite)和长光华芯已经具备了极强的上牌桌能力。他们在消费级智能手机的3D结构光泥潭中摸爬滚打多年,其量产的VCSEL芯片在发光效率和波长稳定性(特别是在850nm和940nm频段)上,已经能够与海外一线厂商掰手腕,并大幅拉低了发射端光源的采购单价。
2. 接收端:SPAD阵列
这是整个dToF模组中技术壁垒最深、制造门槛最高的环节。接收端需要极其灵敏的SPAD(单光子雪崩二极管)阵列来捕捉哪怕只有一个微弱的反射光子。同时,它还要对抗环境太阳光的背景噪声(PDE光子探测效率)。过去,这个市场几乎被索尼的定制化产线独占。
但如今,国内的灵明光子和芯视界(VisionICs) 正在从底层突围而出。它们绕开了传统的平面工艺,直接切入高难度的3D堆叠工艺——利用先进的混合键合技术,将SPAD传感器裸片与下方的逻辑处理电路裸片直接面对面堆叠。这不仅将芯片体积压缩到了极致,还大幅降低了高频信号传输的功耗,让整机厂能够在几美金的预算内,买到具备极高信噪比的接收端感光器件。
3. 光学微结构(DOE/Diffuser)
配合发射和接收的,是负责将一束激光打散成数万个散斑的 DOE(衍射光学元件)或 Diffuser(扩散片)。在这个环节里,国内光学微纳加工产业链的成熟,也让这一原本高昂的定制光学组件沦为标准化的走量物料。
未来走势:从高端选配到AI基建
在笔者看来,全球都在迎来轻量化AI智能眼镜时代的快速普及。在此基础上,微型dToF激光雷达的产业地位必将发生根本性反转。
在未来1到2年内,随着纵慧芯光、灵明光子等本土光电芯片厂的产能释放和良率攀升,一套完整微型dToF模组的BOM成本或将被无情地从20美金以上打到5美金以内。
届时,微型激光雷达将不再是高端XR机型的专属炫技配置,它将和麦克风、扬声器一样,成为所有AI/XR智能终端与物理世界彻底接轨的底层标准基建,智能眼镜对物理世界的探索将跨越一个台阶,真正成为人们的第三只眼。
文 / R星人
(文中未注明图片均来自网络)
热门跟贴