中科院 2 区文献独家解读

一个预测术后恢复的模型

打开网易新闻 查看精彩图片

领域导读

临床预测模型是医学版的“算命”。患者、医生都是模型构建者。患者自我评估越来越重要。

临床预测模型就是一种统计模型,可以是传统的统计学,也可以是人工智能(包括机器学习)。

无论哪种模型,本质是根据一系列患者特征估算某种临床结果的概率,在临床实践中可用于对疾病严重程度进行分层,并描述疾病风险或疾病预后。

除了临床和生物数据,患者自我评估相关数据已成为重要角色,也主导着一些临床预测模型(如本文)。

在缺乏优质数据的现实环境下,该文献亮点是借用了既往的随机对照临床试验(RCT)数据,并充分利用了数据特征带来的优势,进行了规范的建模。下面给出解读。

内容提要

摘要

(翻译+原文)

打开网易新闻 查看精彩图片

概念清障

QoR-40:Quality of Recovery,恢复质量评分-40。基于患者自我评估,含两大类 40 个问题,评估身体舒适度、情绪状态、身体独立性、心理逻辑支持和疼痛。具有良好的心理测量特性、效度、重测可靠性和内部一致性。患者自主完成问卷只需约 7 分钟。

ASA 分级:指的是美国麻醉医师协会(ASA)于麻醉前根据病人体质状况和对手术危险性进行分类,将病人分成的六级。该指标在各医院围手术期均常规采集。是外科建模的利器。

HADS:Hospital Anxiety and Depression Scale 医院焦虑和抑郁量表,基于患者主观感受。

关键启示

1. 研究亮点:数据来源

本文作者“一鱼两吃”,用两个既往随机对照临床试验(RCT)数据开发了模型。是不是为大家提供了新思路呢?

这两个麻醉药物的 RCT(编号NCT01441843;NCT01993459)本身并不是用来建立预测模型的,甚至两个研究对象都不同:一个是咪达唑仑,一个是劳拉西泮,但都是苯二氮卓类,也都采集了 QoR-40 问卷。

打开网易新闻 查看精彩图片

图释:两个 RCT 一个被当作训练集,用于建模;一个被当作验证集,验证模型表现(点击可放大)

2. 如何选择和对待患者数据:模型的“变量”处理

作者通过评价既往文献,筛选出如下变量以供选择:年龄、性别、既往手术情况、体重指数(BMI)、ASA 分级、手术持续时间、医院焦虑抑郁量表(HADS)和 QoR-40。

以上这种通过文献查找循证医学证据的方法,就是基于专家意见 (theory-based) 的变量筛选,这是目前最提倡的首要方法,可见临床建模需要与临床意见全程紧密结合,医生远不只是提供数据。

相比之下另一种变量筛选方法是单纯的数据驱动 (data-driven), 是指不考虑真实临床意义,只计算数值上的显著性,更适合样本量大、变量多的情况,常见于机器学习乃至人工智能。

基本模型最终选用变量:年龄、性别、至少做过一次手术、体重指数、ASA 评分和手术持续时间,共 6 个。

复杂模型最终选用变量:年龄、性别、既往手术、BMI、ASA、手术持续时间、HADS 和术前 QoR-40 评分,共 8 个。

特别指出,年龄、性别一般是放之四海皆有用的指标。

在对变量的处理上,作者保持数值变量不变,而非转化为等级变量(比如,将某项检验指标数值转变为“高、中、低”这样的等级变量),这种转化是一种最常见的数据处理错误。推荐参考一个科普视频:数据处理最常见的错误(没有之一)(https://www.bilibili.com/video/BV1tDTceqEmJ/)。

3. 临床预测模型常见难点/争议点:样本量

本研究容易被质疑样本量小。作者给出的解释是,虽然样本少,但因为来自 RCT,所以数据质量好,数据缺失少。

最关键的是,按照每个变量最少 10 个事件(Event per variable, EPV. 即:如果 8 个变量,则阳性结局至少需要达到 80 例)的经验法则,开发和外部验证的有效样本量是足够的。

打开网易新闻 查看精彩图片

图释:除了EPV,其他样本决定因素如图(翻译+原文)

(点击可放大)

4. 外科天然优势:术前术后对比数据

得益于较为严格的流程化诊疗,外科围手术期的指标较为全面,且时效性好有想法的外科同道可以结合自己的兴趣点,探索课题。

5. 提倡:更新模型,而非重建模型

前人设计的临床量表(量表本质上就是预测模型)在后人的临床预测模型上体现价值。

同样地,本研究的作者也提出,后人可以在此模型基础上更新:

“可能有一些(目前未知的)变量会改善当前模型的表现。

因为新的研究(如Enhanced Recovery After Surgery,ERAS,加速康复外科)指出,术前体力活动、营养状况、微创手术技术或麻醉方案以及术后可能需要入住重症监护室,都是值得关注的预后变量。扩大患者范围将有助于研究这些相关变量,从而更新我们的模型。”

再推荐一篇 2022 年发表的高被引文献,解答如何评估并更新模型,也是本公众号文章笔者的偶像 E. W. Steyerberg 作为通讯作者发表的:Methodological guidance for the evaluation and updating of clinical prediction models: a systematic review (参考文献 2)

6. 借鉴:“优点和不足”部分

本研究从几个常见的角度,即样本量、偏倚、模型普适性(泛化性)等来讨论,可以借鉴。

打开网易新闻 查看精彩图片

图释:文章“优势和不足”(原文+翻译)

(点击可放大)

方法论总结

本研究较严格地遵循了系统化方法:临床模型建立七步骤(见下图)

打开网易新闻 查看精彩图片

图释:Clinical Prediction Models (书, 作者 Ewout W. Steyerberg) 总结的建模关键步骤清单

(点击可放大)

然而对于新的模型(如本例),需要在新的时间和应用场景继续验证,这也是大多数临床预测模型研究本身最具独特性之处对于经受住考验的,可能被写进临床诊疗指南,例如预测深静脉血栓的 Wells 评分,有兴趣的读者可以查看本文参考文献 3。

参考文献

[1] van Beek, Stefan, et al. "Development and external validation of a clinical prediction model for predicting quality of recovery up to 1 week after surgery." Scientific Reports 14.1 (2024): 387.

[2] Binuya, M. A. E., et al. "Methodological guidance for the evaluation and updating of clinical prediction models: a systematic review." BMC Medical Research Methodology 22.1 (2022): 316.

[3] Wells, PhilipS, et al. "Accuracy of clinical assessment of deep-vein thrombosis." The Lancet 345.8961 (1995): 1326-1330.

[4] 视频:数据处理最常见的错误(没有之一)(https://www.bilibili.com/video/BV1tDTceqEmJ/)

文案 | 孙梦妍

排版 | 孙梦妍

审核 | 孙梦妍

发布|姜笑南

世界生命科学大会

RECRUIT

关注我们,获取生命科学

学界前沿|促进更多的学术交流与合作

业界前沿|促进更快的产品创新与应用

政策前沿|促进更好的治理实践与发展