撰文:叶修&苏沐橙
从龇牙咧嘴到咀嚼,面部表情与动作无不是健康与疾病的强力映照。正因如此,探究各个面部区域如何协调运动、进而组合出功能多样的全脸动作,便能为理解生理过程提供独特的切入点。
迄今研究表明,无论是人类还是啮齿类动物,都可以依据细微的面部运动模式推知疼痛、困苦与感觉输入。因此,面部一旦被破译,便如同一扇高带宽而精巧的窗口,让我们窥见动物体内无形的大脑与躯体状态。
小鼠与其他哺乳动物(包括人类)共享保守的面部运动控制回路。眼、耳、触须、鼻、口的面部肌肉,直接接受来自脑干运动核而非脊髓的指令,在位置上更贴近脑内加工中心。这种共享的回路构造,使实验室小鼠成为研究面部运动与脑——体过程之间联系的理想模型。
图片来源:Science(2020)
要将面部作为信息丰富的读数器发挥其潜力,需要一套兼具灵敏度、精确度与准确度的框架,以定量地将面部运动与内在状态关联起来。尽管计算机视觉的发展推动了人脸面部运动识别领域,但在小鼠身上刻画全脸运动会面临独特的技术难题。
小鼠面部比人面小一个数量级,其头部的锥形形状又使得单台摄像机难以捕捉全脸范围的运动。现有方法或依赖于放大的单一面部区域(如触须、舌头),或针对面部一侧的部分区域来进行追踪;另一些方法则舍弃时间动态,专注于面部静态图像。
由于小鼠面部的运动相对于整张脸而言要微小得多,最新的三维方法有望捕捉整个动物的运动,但尚未在考察小鼠面部所需的高分辨率下接受检验。
图片来源:Pain (2024)
近日,《Nature Neuroscience》杂志在线刊登了Xun Helen Hou课题组的最新重要工作,该研究借鉴现有无标记姿态评估工具组件,设计一套硬件与软件流程,以构建小鼠面部统一三维视图。他们还通过技术改进减少了现有工具中常见的特征点抖动,进而提升分辨率和灵敏度。
他们将方法命名为Cheese3D,以易用的Python软件包形式发布,并附带交互式可视化工具,可同步查看输入视频数据、面部追踪三维点以及输出的解剖特征。Cheese3D平衡了现有工具的优劣,是首个足以刻画小鼠生理、认知与情绪状态的新型手段。
Cheese3D可稳定捕获小鼠全脸三维运动
Cheese3D以100 Hz的时间分辨率捕获并分析小鼠全脸同步运动。作者引入三对高速摄像机(共计六台)紧凑排布,分别采集正面、侧面及抬高的半侧面视角(图1a, b及扩展数据图1b)。小鼠经适应性训练后位于通道内,其头部通过轻量化头柱固定,该头柱经专门设计以确保各面部区域无遮挡可见(图1b及扩展数据图1b)。六台摄像机时间同步,空间配准通过ChArUco标定板实现。
研究者在C57BL/6J小鼠面部定义了27个关键点,覆盖全部区域(图1c–e及补充视频2)。每个关键点清晰对焦且至少被两台摄像机可见(见补充表1),不同研究人员均可重复标注。经标定的硬件装置与标注流程使研究者能够适配现有无标记姿态估计技术——Anipose和DeepLabCut——从而构建小鼠全脸的统一三维视图。
由于面部运动受限于三维空间,现有二维分析方法要么依赖单摄像机视角,将可研究的运动限制于单一平面内;要么依赖主成分分析或隐马尔可夫模型整合多视角关键点,这妨碍了数据的直接解读。作者选取了由关键点构成的形状所衍生的17个三维几何特征,包括距离、角度、面积和体积(图1f)。这些特征根据已知肌肉解剖学和啮齿类动物面部运动描述,被定位至各面部区域。
他们还将Cheese3D输出的三维几何特征与三维扫描仪(分辨率50 μm)的静态测量结果进行对比,评估了其准确性(图1g–i、扩展数据图2及补充视频3)。为验证六台摄像机的必要性,他们分别省略不同摄像机对并测量相应区域精度的变化(扩展数据图3)。省略正面摄像机导致中线特征(如触须垫隆起)测量偏移,省略抬高半侧面摄像机则导致最外侧特征(如耳部)出现误差。双摄像机设置普遍无法捕获有效特征。六摄像机阵列的另一优势在于其冗余性,确保了面部在部分视角下受遮挡时测量仍可行。
总体而言,六台同步标定的摄像机阵列结合三维几何特征,有效缓解了啮齿类动物面部运动表征中空间分辨率与时间分辨率之间的权衡困境。
笔者注:小鼠全脸面部识别技术突破了传统二维单视角分析的局限,通过多视角三维重建与高精度几何特征提取,首次实现了对全脸各区域(包括耳部、触须垫等传统方法难以覆盖的部位)同步运动的灵敏捕捉。
该技术不仅揭示了面部运动与疼痛、情绪及内在生理状态之间的定量关联,更因小鼠与人类在面部运动控制回路上的演化保守性,为将面部表情作为非侵入性、高信息密度的生理状态读数器奠定了方法论基础,有望在基础神经科学、疾病模型评估及药物筛选等领域发挥重要的桥梁作用。
图一 Cheese3D可稳定捕获小鼠全脸三维运动
Cheese3D的降噪实现了对面部各区域细微瞬态运动的精确测量
为评估Cheese3D检测细微局部面部运动的灵敏度,作者在麻醉状态小鼠静止不动的时段开展控制实验,以量化关键点的抖动幅度。关键点抖动是已知的技术难题,即关键点追踪中的局部波动与实际运动无关,其成因可能包括图像噪音、照明不足、对比度或纹理偏低、训练数据中的标注噪音,以及模型本身对特定关键点的不确定性。
在所选取的面部关键点中,人工标注者不仅依赖纹理,还要综合颜色和形状来判断关键点的位置。卷积神经网络通常侧重于纹理来解决目标识别任务,故某些主要依赖纹理定位的关键点会比其它关键点的学习更为可靠。关键点抖动通常通过低通滤波器加以抑制,但这种方法会削弱动态信息并降低检测的时间分辨率。
与单目二维未标定视角相比,三维多视角标定的一个关键优势在于视角冗余能够减小关键点抖动的幅度,让更细微、更快速的运动得以被检测。在静止时段,作者在未施加任何滤波的条件下检测到三维关键点的抖动(图2a、b),并测量了从二维关键点投影至二维视角后的三维关键点抖动的减小程度(图2c–e;更多细节见扩展数据图4)。此外,本研究使用现存的二维小鼠面部姿态追踪工具Facemap对相同的视频数据进行了处理(图2f及扩展数据图6)。在所有比较中,三维三角测量后关键点抖动均有所降低。
他们还进一步考察了关键点抖动对几何特征的影响,这为区分Cheese3D所能检测的关键点追踪噪声与真实运动提供了小鼠特异性的阈值参考(扩展数据图5)。
笔者注:关键点抖动是指面部追踪中因图像噪音、光照不足或模型不确定性等因素导致的局部定位波动,这种非真实运动的伪迹会干扰对细微面部动作的准确识别。
传统二维追踪方法受抖动影响较大,常依赖低通滤波抑制但牺牲了时间分辨率;而Cheese3D通过三维多视角标定引入视角冗余,显著降低了关键点抖动幅度,从而在不损失时间精度的前提下实现了对微小、快速面部运动的灵敏检测。
图二 六视角数据重建有效降低关键点追踪抖动
通过外部面部运动揭示内在生理状态
为验证Cheese3D捕捉细微生理性面部运动的能力,作者监测小鼠从氯胺酮麻醉中苏醒的过程。麻醉期间出现触须偏转等微小运动,标志着早期苏醒。与肢体大幅运动不同,微小面部运动的灵敏追踪面临独特挑战。他们将抖动分析阈值应用于Cheese3D记录的麻醉期面部运动,不同面部区域呈现各自的时间模式(图3a、b),表明Cheese3D可有效检测麻醉及苏醒相关的微小运动。
他们进一步考察Cheese3D能否追踪外部不可见的生理过程。在整个麻醉周期,小鼠耳部和眼部等面部特征呈现渐进性变化,且在不同轮次及个体间模式稳定(图3c),提示某些特征可作为跨个体的麻醉“计时器”。然后,作者基于所有小鼠数据拟合单一模型,仅通过滤波后面部特征即可预测麻醉诱导后的时间,其预测能力与脑电特征相当(图3e-i)。
为进一步评估面部特征的麻醉标记,作者在麻醉30分钟后再次注射半剂量麻醉药或生理盐水,发现给药组与对照组小鼠在耳角、眼高和鼻隆起方面呈现显著差异(图3j–l),表明面部特征可追踪麻醉深度的逐刻变化。
作者还测试了Cheese3D对大幅度面部运动的检测效果。啮齿类的咀嚼运动因其牙齿与食物的不可视而难以外部表征,现有方法依赖肌电图等侵入性手段。作者假设Cheese3D可通过外部面部运动直接评估咀嚼动力学。他们记录小鼠进食脆性颗粒的过程,口部三角形面积(张口度)随时间呈现两种模式,分别对应食物堵塞口腔与口腔闭合(图4c)。该发现与啮齿类门齿—臼齿间的齿隙解剖结构一致(图4g)。全脸分析还显示,所有小鼠咀嚼时眼球突出与咀嚼动作时间相关,可能由咀嚼肌包绕眼眶底部的解剖特征所致(图4h–k)。
为检测摄食过程中精细运动学的时序变化,作者系统追踪食物受限小鼠在每轮接受50颗颗粒(间隔30秒)时的面部运动(n = 7)。他们以勺送出后口部面积超过3 mm²的时间定义摄食启动(图4l)。随颗粒持续给予,张口潜伏期显著延长(图4l、m),可能反映饱腹感增加,该趋势在各小鼠中一致(图4n)。在测试范围内(85–91%正常体重),潜伏期变化率与食物限制强度无显著相关(图4o)。
综上,Cheese3D面部特征分析揭示了摄食行为的细微特征。
笔者注:小鼠在麻醉与咀嚼过程中展现出截然不同且高度规律的面部运动模式。麻醉状态下,面部呈现渐进性的全局变化,耳部角度、眼部高度及鼻部隆起等特征随时间线性演变,可在不同个体间作为追踪麻醉深度的稳定“计时器”;而咀嚼过程中,口部区域的运动则表现为张口面积的快速节律性波动,并与眼球突出等周围面部运动时间耦合,反映出食物摄入、牙齿解剖结构及咀嚼肌活动的动态协调。
Cheese3D三维追踪技术能够同时捕获这两类差异显著的面部表情,证明面部运动可灵敏映射麻醉脑状态与摄食行为等内隐生理过程,为非侵入性生理监测提供了丰富的表型信息。
图三 氯胺酮麻醉诱导与苏醒过程中的面部时序特征
图四 咀嚼过程中口部及周围面部区域的运动学特征
基于Cheese3D与电生理同步记录的面部运动与运动控制机制关联研究
面部肌肉受脑干运动网络支配,因此建立面部运动与运动控制机制的关联,是理解全脑活动与面部行为联系的关键。作者通过四针硅探针对麻醉小鼠脑干进行局灶电刺激,改变电流幅度和位置以制造细微反应差异,探究面部运动的基本构成单元(图5a)。
作者首先确定Cheese3D可检测的最小运动幅度。他们对探针靶区进行不同电流幅度的整体刺激,发现Cheese3D可检测到小至2.66 μm的眼高变化,且随电流增大而增强(图5b)。局灶刺激下,不同面部特征表现出空间定位性反应(图5c、d)。复合特征(如触须垫体积)的反应随刺激位置而异,突显其量化全脸复杂运动的能力。局部与复合反应之外,面部同侧与对侧亦存在不对称性(扩展数据图10)。
与Cheese3D同步的清醒小鼠电生理记录显示,自发性运动中脑干神经活动与面部特征相关(图5g)。作者在尾侧桥脑网状核发现对耳部运动具有方向特异性调谐的神经元(图5g、h),与过去研究一致。以单一面部特征为输入的泊松广义线性模型可预测脑干神经元活动(图5i、k),单一特征对单个单元方差的解释率最高达30.05%(图5j、k)。
综上,Cheese3D具备将脑干神经元活动与面部运动相关联的精密度与准确度,通过定向刺激与自发运动两种方式均得到验证。该工具能测量近乎相同运动间的细微差异,是揭示面部运动内在机制的有力手段。
图五 Cheese3D与电生理同步记录揭示运动控制活动与细微面部运动的关联
本文的局限性
本篇文章在技术方法上具有突破性意义,但研究仍存在若干值得深入探讨的局限性。其一,脑干电刺激实验虽证实了Cheese3D对局部运动反应的检测精度,但刺激靶区内不同神经元类型对诱发运动的贡献尚未明确区分,运动控制网络中具体哪类神经元群主导特定面部特征的表达仍需进一步解析。其二,文章虽通过广义线性模型建立了面部特征与脑干单神经元活动之间的定量关联,但对下游运动输出通路(如脑干投射至面神经核的具体环路)及中间神经元的转导机制未作系统阐释,面部运动指令从脑干到肌肉的执行路径尚存未解环节。其三,行为范式主要聚焦于麻醉状态、摄食行为及急性电刺激诱发的运动反应,而Cheese3D在病理状态(如神经病理性疼痛模型、社交障碍模型)下面部表情的长期追踪与临床转化潜力尚未验证,慢性疼痛或情感异常状态下的面部运动规律或许具有更大的应用价值。
总结
面部表情与运动,从稍纵即逝的细微痛苦面容到剧烈快速的咀嚼动作,均可为神经与生理过程的逐刻变化提供直接洞察。小鼠具有可辨识的面部反应和演化上保守的哺乳动物面部运动控制回路,是揭示面部运动与内在状态之间联系的理想模型。然而,现有技术框架因小鼠面部尺寸小且呈锥形,缺乏同时追踪全脸所有运动所需的空间或时间分辨率。
本文开发一种计算机视觉系统——Cheese3D,通过经标定的六摄像机阵列,以亚毫米级精度捕获小鼠全脸(包括耳、眼、触须垫和下颌,覆盖面部两侧)的高速三维运动。该技术以绝对世界单位为度量,提取具有解剖学意义的三维面部特征的动力学参数,精度达亚毫米级。Cheese3D生成的全脸精密运动数据提供了清晰的成像结果,可通过面部模式变化预测麻醉深度、从全脸快速摄食运动中推断牙齿与肌肉解剖结构、测量脑干刺激诱发运动的微小差异,以及将神经活动与自发性面部运动(包括仅可在三维空间中测量的表情特征,如耳部运动角度)相关联。
Cheese3D可作为一种新型工具,将小鼠细微的面部运动转化为高度可解释的读数,用以揭示原本不可见的内在过程。
参考文献
Daruwalla K, Nozal Martin I, Zhang L, Naglič D, Frankel A, Rasgaitis C, Zhao R, Zhang X, Ahmad Z, Borniger JC, Hou XH. Cheese3D enables sensitive detection and analysis of whole-face movement in mice. Nat Neurosci. 2026 Jun;29(6):1510-1521. doi: 10.1038/s41593-026-02262-8. Epub 2026 Apr 27. PMID: 42045464; PMCID: PMC13246446.
欢迎转发分享
热门跟贴