内容来自:“小白学统计”微信公众号,感谢作者授权
本文摘自下面文章的一部分(有改动):
Guoshuang Feng, Guoyou Qin, Tao Zhang, Zheng Chen, Yang Zhao. Common Statistical Methods and Reporting of Results in Medical Research. CVIA. 2022. Vol. 6(3):117-125.
感兴趣的朋友可以看原文。
本文根据审稿中见到的一些不大规范的介绍和结果展示,说一下如何在专业论文中介绍回归方法以及如何在表格中展示回归结果。当然,这些内容对专业人员来说都不算太难,主要是希望能对非统计学专业的临床人员提个醒,尽量在撰写论文时保持规范。
回归分析结果其实很简单,比如线性回归,通常可如下表达(表1):
logistic回归通常可展示为下面的表格形式(表2):
然而有的临床大夫在文章介绍和展示时,(从统计学角度)或多或少存在一定问题,下面简单说一下:
(1)只报道参数估计值和P值
如下图,只报道了各变量的参数估计值和P值。
或者如下图,只报道了参数估计值、t值和P值。
建议大家:如果限于篇幅,难以展示很多列,建议至少报道参数估计值及其95%置信区间,不建议只报道参数估计值和P值。如果要在P值和95%置信区间选一个,选择置信区间而不是P值。哪怕是参数估计值和标准误的组合,也比参数估计值和P值的组合更好。
对于logistic回归,如果只显示两列,可以是OR值和置信区间组合,而不是OR值和P值组合。
(2)多分类自变量只有一个结果
如果自变量是多分类变量,通常以虚拟变量形式纳入模型,这时候展示就需要按虚拟变量的格式。
比如下面这个例子,这里面的职业、文化程度都是多分类,但却只显示了一行结果,这就是明显的错误。
对于k类的分类变量,以虚拟变量的格式纳入模型,就会有k-1个结果,而不是只有一个结果。
虚拟变量的展示应该如前面的表1和表2的样子,比如表2的年龄分了3类,就应该有3-1=2行的结果。通常参照类可以用ref表示,例如年龄以<35作为参照,那这一行就可以用ref表示,或者也可以在OR值写成1。
(3)应根据不同的研究目的展示不同的指标
有的文章不管研究目的是作危险因素筛选,还是作混杂因素校正,还是预测建模,等等,文中指标的报道都比较随意。
例如,危险因素筛选中中通常R2并不是很必要,即使R2较小,也并不意味着筛选的危险因素不合理。
再如,预测建模类的分析中,就不能简单只基于P值说变量的预测效果,而应结合ROC、校准曲线等多个指标,从不同角度评价预测效果。
(4)方法介绍应说明方法的适用性
目前绝大多数文章的介绍回归分析时,都轻描淡写地一句:采用线性回归(logistic回归等)进行分析。然而,所有的回归都有其适用条件,应对这些条件有所说明,否则不清楚数据是否满足应用条件,也就无法保证结论的可靠性。
例如,COX回归至少应说明数据是满足等比例假定,如果不能满足,采用了什么方法进行替代;再如,线性回归应明确自变量满足线性等条件,如果不满足,进行了什么处理,等等。
本文简单介绍了回归分析中方法介绍和结果展示的一些问题,这些问题是审稿中常见到的。
热门跟贴