目前,全球有5.37亿成年人患有糖尿病,预计到2030年这一数字将增至6.43亿,其中约90%为2型糖尿病。胰岛素抵抗(IR)作为2型糖尿病的主要前期病变,其特征是身体组织对胰岛素的作用减弱,导致胰腺β细胞需要分泌更多胰岛素才能维持正常血糖。然而,目前的诊断方法——无论是高胰岛素正葡萄糖钳夹技术还是HOMA-IR计算——都因成本高昂、操作复杂或需要临床实验室就诊而难以普及,导致大量处于早期胰岛素抵抗阶段的人群错失干预良机。

谷歌公司研究部门Ahmed A. Metwally研究团队提出了一种利用可穿戴设备数据和常规血液生物标志物预测胰岛素抵抗的创新方法研究通过对1165名参与者的大规模远程队列分析,结合深度学习神经网络,开发了多模态预测模型。该模型以HOMA-IR(稳态模型评估的胰岛素抵抗指数)2.9为阈值,在结合可穿戴设备数据、人口统计学信息和常规血常规指标后,实现了0.80的AUROC(受试者工作特征曲线下面积),敏感度达76%,特异度达84%。这一成果为代谢风险的早期检测提供了可扩展、易获取的解决方案,有望通过及时的生活方式干预阻止2型糖尿病的进展。相关论文以“Insulin resistance prediction from wearables and routine blood biomarkers”为题,发表在Nature上。

打开网易新闻 查看精彩图片

研究团队首先对胰岛素抵抗与生活方式及血液生物标志物的关联进行了深入分析。结果显示,HOMA-IR与空腹血糖、BMI、糖化血红蛋白、甘油三酯呈显著正相关,与高密度脂蛋白胆固醇、每日步数、心率变异性呈显著负相关(图1c)。具体而言,静息心率较高的人群胰岛素抵抗风险更高(图1d),而每日步数较多(图1e)和心率变异性较高(图1f)的人群则表现出更好的胰岛素敏感性。在血液指标方面,甘油三酯水平随胰岛素抵抗程度升高而增加(图1g),HDL胆固醇则呈现相反趋势(图1h),白蛋白/球蛋白比值也与胰岛素敏感性正相关(图1i)。值得注意的是,在458名肥胖参与者中,有205人存在胰岛素抵抗,而在319名正常体重参与者中,仅有22人存在这一问题(图1j)。更令人警醒的是,在972名血糖正常的参与者中,有196人已经存在胰岛素抵抗,这部分人群正是2型糖尿病的高危群体(图1k)。

打开网易新闻 查看精彩图片

图1 | 研究设计与数据总结。a ,导致胰岛素抵抗、糖尿病前期的生理因素及相关生活方式因素概览。 b ,我们提出的预测HOMA-IR并用胰岛素抵抗素养与理解智能体解读结果的建模流程。 c ,血液生物标志物和生活方式特征(连续值)与HOMA-IR的相关性。 d-f ,按胰岛素敏感性分组(胰岛素敏感、受损胰岛素敏感和胰岛素抵抗)划分的,与HOMA-IR高度相关的三大可穿戴特征分布:静息心率( d )、每日步数( e )和心率变异性( f )。 g-i ,按胰岛素敏感性分组划分的,与HOMA-IR高度相关的三大血液生物标志物分布:甘油三酯( g )、高密度脂蛋白胆固醇( h )和白蛋白/球蛋白比值( i )。在箱线图 d-i 中,中心线表示中位数,箱体边界代表第25和75百分位数,触须延伸至1.5倍四分位距。 j ,BMI与HOMA-IR值的散点图,展示了较高BMI值与胰岛素抵抗之间的关系。 k ,显示胰岛素抵抗状态与糖尿病状态各组合下参与者数量的混淆矩阵。

在模型性能评估方面,研究团队比较了不同输入特征组合的预测效果。仅依靠可穿戴设备和人口统计学信息,模型的R²仅为0.22(图2b)。加入血脂 panel后,R²提升至0.31,真阳性识别从184人增加到206人,同时将将胰岛素敏感者误判为胰岛素抵抗的假阳性从48人减少至34人(图2c)。加入空腹血糖后,模型表现进一步提升至R²=0.44,真阳性达216人,假阳性降至26人(图2d)。当同时纳入可穿戴数据、人口统计学信息、空腹血糖、血脂panel和代谢panel后,模型达到最优表现,R²=0.50,真阳性达229人,假阳性仅6人(图2e)。

打开网易新闻 查看精彩图片

图2 | HOMA-IR预测性能(回归)评估。a ,不同输入特征集和模型下HOMA-IR回归效果的比较。 b–e ,选定特征集的预测HOMA-IR值与真实HOMA-IR值的散点图:可穿戴数据与人口统计数据( b ),可穿戴数据、人口统计数据与血脂组合( c ),可穿戴数据、人口统计数据与空腹血糖( d ),以及可穿戴数据、人口统计数据、血脂组合与代谢全套指标( e )。关注的真阳性和假阴性区域分别用浅绿色和浅棕色高亮显示。

为了更充分地利用可穿戴设备的时间序列数据,研究团队引入了一个基于4000万小时传感器数据预训练的可穿戴基础模型(WFM)。该模型能够从分钟级分辨率的数据中提取高维特征表示(图3a)。实验表明,结合WFM嵌入特征与人口统计学信息的模型,其AUROC达0.82,显著优于仅使用人口统计学信息的基线模型(0.66)(图3b)。SHAP分析进一步证实,在WFM增强的模型中,可穿戴数据的特征重要性贡献高达82%,远高于传统机器学习模型的43%(图3c),说明WFM成功捕捉了与胰岛素抵抗相关的复杂生理动态变化。

打开网易新闻 查看精彩图片

图3 | 利用可穿戴基础模型改进可穿戴数据在胰岛素抵抗预测中的应用。a ,可穿戴基础模型预训练与推断组件的示意图。 b ,量化可穿戴基础模型在改进胰岛素抵抗预测中附加价值的性能指标。 c ,针对不同实验设置,量化可穿戴基础模型中可穿戴嵌入特征对预测性能的相对贡献的SHAP分析。

在独立的验证队列(72名参与者)中,研究团队进一步验证了模型的外推能力。该队列参与者平均年龄44.5岁,平均BMI 30.6 kg/m²,包含多样化的种族背景(扩展数据表2)。结果显示,整合WFM嵌入特征与人口统计学信息的模型AUROC达0.75,优于人口统计学基线模型的0.66。更为重要的是,在包含人口统计学信息、空腹血糖和血脂panel的最优模型中,额外加入WFM嵌入特征使AUROC从0.76显著提升至0.88(图4b),充分证明了可穿戴数据在胰岛素抵抗预测中的增量价值。

打开网易新闻 查看精彩图片

图4 | 模型在独立验证队列中的表现。a ,独立验证队列的研究概述。 b ,基于不同实验设置(不使用可穿戴数据、使用聚合可穿戴数据、使用可穿戴基础模型)的胰岛素抵抗分类在独立验证队列中的表现。

研究团队还开发了一个基于大语言模型的胰岛素抵抗解读与理解代理(IR agent)。该代理采用推理与行动框架,能够结合用户的健康数据、调用网络搜索和专业工具,为用户提供个性化的代谢健康解读(图5a)。经五名内分泌学专家的盲法评估,相较于基础LLM,IR agent在回答的全面性、可信度和个性化程度方面分别获得80%、92%和73.3%的偏好率(图5b)。在实际案例中,当用户糖化血红蛋白为5.1%、空腹血糖96 mg/dL看似正常时,IR agent能够结合预测的HOMA-IR值(4.9)和BMI(39.9),准确识别出用户的胰岛素抵抗风险,并提供个性化的生活方式建议(图5c)。专家评估显示,IR agent的回答事实准确率达79%,安全率达96%,在HOMA-IR值的引用和解释方面准确率分别达100%和96%。

打开网易新闻 查看精彩图片

图5 | 胰岛素抵抗智能体概述。a ,提出的胰岛素抵抗智能体示意图。 b ,由内分泌学家通过并排比较评估,我们的胰岛素抵抗智能体相对于基础模型的胜率。 c ,一个与真实研究参与者数据配对的代谢相关问题示例,以及相应的胰岛素抵抗智能体输出。

这项研究的创新之处在于首次构建了一个可部署的端到端胰岛素抵抗预测框架,充分利用了可穿戴设备的持续监测能力和常规血液检查的易获取性。研究表明,即使是简单的静息心率、心率变异性和步数等指标,也能为代谢健康评估提供重要信息。研究团队指出,虽然HOMA-IR目前因胰岛素检测的成本和物流挑战而未被常规评估,但该模型可作为筛查工具,优先筛选出需要进一步进行临床胰岛素检测的高危人群。未来,随着可穿戴设备的普及和公众对持续健康监测认知的提升,这一方法有望推广至数百万人群,实现代谢疾病的广泛早期识别。研究团队强调,对于已检测出胰岛素抵抗的个体,通过抗阻训练、有氧运动、热量限制饮食等生活方式干预,以及必要时的药物干预,完全有可能逆转胰岛素抵抗,阻断2型糖尿病的发展进程。