内容来自:“小白学统计”微信公众号,感谢作者授权
本文摘自下面文章的一部分(有改动):
Guoshuang Feng, Guoyou Qin, Tao Zhang, Zheng Chen, Yang Zhao. Common Statistical Methods and Reporting of Results in Medical Research. CVIA. 2022. Vol. 6(3):117-125.
统计描述在绝大多数的文章中都会有,不管是随机对照试验、观察性研究等等,都需要有数据描述部分。统计描述看似很简单,然而在一些细节方面其实很多研究人员都没有注意。本文主要介绍一下统计描述中需要注意的一些问题:
(1)关于统计描述表格的几个基本特征
第一,尽管表格规范一般认为,主语在左侧作为横标目,谓语在上方作为纵标目,这样读起来比较通顺。我当年有一篇投稿,就被专家质疑,说我把分析变量放到了横标目上,不符合表格的规定,说这样读起来不顺,让我一定要放在纵标目。但是,大家可以看一下把分析变量放在纵标目的效果(这真的是我们想要的吗):
上面这个真的是严格按照“规范”来,把分析变量作为谓语坚决地放在纵标目。万一再增加2个变量该怎么办呢?
有时候“尽信书则不如无书”。在基线描述中,由于需要展示的指标通常都较多,建议还是以组别作为纵标目,各分析变量作为横标目更好一些。就像下面表格一样(表1):
第二,不同变量建议可列出对应的计量单位,如ng/ml、岁等,这对某些有多种计量单位的指标尤为必须。
第三,需要对表格做进一步解释说明的,通常在表格下方进行标示,如表1标示说明了百分比之和可能不是100%的原因。
第四,通常表中需要列出各组的例数,如果不同指标的缺失例数不同,需要对每一指标分别列出各自例数,或针对每一指标列出缺失例数。
(2)定量资料统计描述指标应保留小数点后多少位?
目前关于该问题尚无十分明确的规范,如SAMPL(Statistical Analyses and Methods in the Published Literature)规范给出的建议是:小数点后应保留合理的位数,不能太少,也不能太多。EASE(European Association of Science Editors)规范的建议是:保留2-3位有效数字。Habibzadeh建议:像均值、标准差、中位数、四分位数间距等指标,不应超过原始数据的精度。过于粗略或过于精细,都会产生一定问题。
我们认为Habibzadeh的建议比较合理,可以考虑。例如,红细胞计数有1位小数,血红蛋白是整数,则可以写“红细胞计数的均值(标准差)为4.7(0.4)×1012/L,血红蛋白的均值(标准差)为136(12)g/L。”
(3)定性资料(分类资料)统计描述指标应保留多少位小数?
关于分类资料百分比的小数位数,多数情况下保留1位小数即可,如果作为主要研究指标需要重点描述,可根据情况保留2位小数。如果分母例数小于100,建议百分比以整数形式报道,无需保留小数点。如80人中发生20例阳性,可报道为:“80例观察对象中发生20(25%)例阳性结局”。因为当分母不足100例时,分子例数每增加或减少1例,其变化幅度都大于1%。
(4)百分比的报道需要谨慎
第一,如果总例数太少(如分母小于20),建议最好不报道百分比,因为此时报道百分比容易引起误导。例如,10例患者中6例治疗有效,据此下结论认为“60%的患者治疗有效”,并不是很有说服力。如果要报道,建议同时给出例数或95%置信区间(Confidence Interval,CI),且下结论需要谨慎。
第二,如果率(如发病率)作为主要研究指标,强烈建议同时报道其95%CI,以反映结果的精度(precision)。如28%的发病率可在文章中写为“本次调查的发病率为28%(95%CI:26-30%)”。如果只报道率指标,提供的信息不够充分。例如,同样的30%的发病率,100例中发生30例的95%CI为21-39%,而10000例中发生3000例的95%CI为29.1-30.9%。二者的精度相差了10倍。
(5)关于分类变量的百分比展示方式
分类变量的百分比通常有两种展示方式(如下面的表2),它们表达的含义截然不同。表2中,当行合计为100%时,此时侧重体现的是男性、女性各自的发病率情况;当列合计为100%时,此时侧重说明的是发病、未发病人群中各自的男女比例情况。
如何展示百分比?建议遵循这一原则:每个“分组”变量内的合计为100%。
也就是说,要先确定哪个变量是分组变量,哪个变量是分析变量。如表2,如果以性别作为分组,应以行合计为100%,此时表格反映了:男性的发病率与女性相比高还是低;如果以发病与否作为分组变量,则应该是列合计为100%,此时表格反映了:发病人群与未发病人群相比,男性(或女性)比例是高还是低。
总之,即便是一些看似很简单的内容,也许在一些细节方面也会有忽略之处。另外,随着我们进入大数据时代,有些几十年前一直沿用至今的“规范”是不是也应该与时俱进,进行修正呢?引经据典固然是好,但也不能死搬教材。有时我给学生上课的时候会想,学生们是不是有点缺乏自己的独立思考?也许让学生们多一些质疑的思想、少一些死板的顺从是有好处的。当然,不止学生,也许我们自己也应该有更多的质疑的思想,而不是一味地只会说“教材这么说的”、“专家这么说的”。
医咖会在2023年上线了样本量计算小工具,将既往推出的样本量计算教程融入到每一步操作中,并有每个参数的说明以及取值建议。 点击左下角“阅读原文”即可使用,手机端和电脑端均可以体验哦!
热门跟贴