苹果富贵、Meta省钱，XR 深度感知真正的第三条路在中国|xr|光子|光学|苹果公司|苹果富贵|量子网络|阵列|雷达

智能眼镜既然都戴在脸上了，产品的核心就在于能跟人类一样看到物理世界。然而，目前的AI智能眼镜（如Ray-Ban Meta）大多只通过RGB摄像头让大模型看到画面。

问题是RGB画面缺乏绝对的物理尺度。大模型知道画面里有一个杯子，但无法判断杯子距离用户是30厘米还是80厘米。

此时，如果纯靠视觉算法去反推空间深度，需要持续压榨NPU或GPU的算力，这对于电池容量只有一两百毫安时的智能眼镜来说，后果可能是毁灭性的。

那么，假以时日纯视觉（CV）算法是否完全能替代深度传感器呢？代码真的能驾驭物理规律吗？

我们举个例子，如果一台头显被砍掉了dToF（直接飞行时间）激光雷达，然后被拿进暗光卧室或者毫无特征的白墙房间，纯视觉方案效果如何呢？实际上纯视觉方案最拿手的空间网格（Mesh）大概率会抓瞎，因为头显失去了绝对的三维物理尺度，本质上是在猜距离，而不是测量。

所以，物理世界的问题终归要用物理器件来解决。不过，要想让头显和眼镜具备准确的物理测量功能，也不是掏钱怼料那么简单。研发团队需要在几毫米的封装内压住发射端纳秒级的发热，并把整体功耗死死锁在毫瓦级，实操的难度极大。

面对这道颇具撕裂感的难题，目前XR领域的两大代表性巨头给出了两套逻辑不同的解法。然而对于中国的厂商，恕我直言不讳：学谁都不行，必须走第三条路。

空间计算玩法：富人 vs 穷人

当前，在空间网格划分（Mesh）和深度感知上，全球XR硬件巨头貌似走向了两个极端阵营。在旁观者看来，这场路线之争的本质就是BOM（物料清单）成本的战争。

阵营一：苹果的“富贵打法”（dToF路线）

从iPad Pro到Apple Vision Pro，苹果依靠强大的供应链掌控力和产品溢价，坚定不移地走 dToF（直接飞行时间）路线。这套方案通过发射极短的激光脉冲，计算光子往返的时间差，从而获得绝对的三维物理坐标。

为了支撑这套系统，苹果找索尼定制了昂贵的SPAD（单光子雪崩二极管）阵列。毫无疑问，这种“富贵打法”带来的物理体验是碾压级的：无论是在纹理极其单一的白墙前，还是在全黑的卧室里，Vision Pro的手势追踪和空间定位依然稳如磐石，几乎不存在丢失深度的可能。

阵营二：Meta的“穷人打法”（纯视觉/双目RGB路线）

与之形成鲜明对比的是行业领头羊Meta。为了死守Quest 3 最终 499美元的C端零售价，Meta的硬件团队在产品定型前，挥刀砍掉了原本计划搭载的深度传感器。取而代之的是纯靠两颗高分辨率RGB摄像头，辅以CV（计算机视觉）算法来“猜”深度。

如果观察一下物料清单，外界会发现Meta这套打法能省下大约二三十美金的BOM成本，但代价就是纯视觉方案在暗光环境下直接抓瞎；面对没有特征点的纯色桌面，深度估算会发生严重漂移；当两只手快速交叠时，边缘像素的扭曲肉眼可见。视觉算法算的是概率，而激光雷达测的是物理距离。

与此同时，国内众多渴望冲击高端的XR整机厂商，也处于一定的焦虑之中：他们想拥有苹果级别的空间精度，但兜里的硬件预算却不在一个量级上。怎么办呢？

第三条路的底层支撑：那些国产隐形英雄们

在这场BOM成本的博弈中，真正能够打破索尼、Lumentum等海外大厂价格垄断，把微型雷达从“选配”变成“标配”的，是一批长期蛰伏在消费电子底层的国产光电芯片隐形英雄。

好像之前从来没人专门讲过他们，今天我就挨个点名吧。由于笔者见识有限，可能也不全，欢迎大家在评论区批评补充指正。

如果仔细观察XR世界微型dToF架构，会发现其核心由发射端（TX）、接收端（RX）和光学微结构组成。

1. 发射端：VCSEL芯片

XR设备的dToF发射端必须使用 VCSEL（垂直腔面发射激光器）。它的难点在于，要在极小的die（裸片）面积内，实现极高的峰值功率密度和纳秒级的极速开关响应。同时，光电转换效率（PCE）必须极高，否则浪费的电能会全部转化为热能，直接把周围的树脂镜片烤化。

在这个环节，国内的纵慧芯光（Vertilite）和长光华芯已经具备了极强的上牌桌能力。他们在消费级智能手机的3D结构光泥潭中摸爬滚打多年，其量产的VCSEL芯片在发光效率和波长稳定性（特别是在850nm和940nm频段）上，已经能够与海外一线厂商掰手腕，并大幅拉低了发射端光源的采购单价。

2. 接收端：SPAD阵列

这是整个dToF模组中技术壁垒最深、制造门槛最高的环节。接收端需要极其灵敏的SPAD（单光子雪崩二极管）阵列来捕捉哪怕只有一个微弱的反射光子。同时，它还要对抗环境太阳光的背景噪声（PDE光子探测效率）。过去，这个市场几乎被索尼的定制化产线独占。

但如今，国内的灵明光子和芯视界（VisionICs）正在从底层突围而出。它们绕开了传统的平面工艺，直接切入高难度的3D堆叠工艺——利用先进的混合键合技术，将SPAD传感器裸片与下方的逻辑处理电路裸片直接面对面堆叠。这不仅将芯片体积压缩到了极致，还大幅降低了高频信号传输的功耗，让整机厂能够在几美金的预算内，买到具备极高信噪比的接收端感光器件。

3. 光学微结构（DOE/Diffuser）

配合发射和接收的，是负责将一束激光打散成数万个散斑的 DOE（衍射光学元件）或 Diffuser（扩散片）。在这个环节里，国内光学微纳加工产业链的成熟，也让这一原本高昂的定制光学组件沦为标准化的走量物料。

未来走势：从高端选配到AI基建

在笔者看来，全球都在迎来轻量化AI智能眼镜时代的快速普及。在此基础上，微型dToF激光雷达的产业地位必将发生根本性反转。

在未来1到2年内，随着纵慧芯光、灵明光子等本土光电芯片厂的产能释放和良率攀升，一套完整微型dToF模组的BOM成本或将被无情地从20美金以上打到5美金以内。

届时，微型激光雷达将不再是高端XR机型的专属炫技配置，它将和麦克风、扬声器一样，成为所有AI/XR智能终端与物理世界彻底接轨的底层标准基建，智能眼镜对物理世界的探索将跨越一个台阶，真正成为人们的第三只眼。

文 / R星人

（文中未注明图片均来自网络）