如何计算两组数值的相对差异百分比？实际上比你想象难得多！

医咖会

2023-10-13 20:02 ·北京

本文转载自“临床研究与循证医学”公众号，感谢授权。

我们经常会用百分数表示一个数据对另一个数值的占比或两数值的差别。根据该定义，直观的算法（算法1）是：相对差异百分比=100%×(两个数据的绝对差异/对比数据)。

例如，英国20岁成年人男女平均身高的相对差异，可用相对百分比来表示。假如已知男女身高的均值分别为177.3cm和163.6cm，两者的绝对差异为13.7cm，如果用相对差异百分比来表示，女性比男性低100%×(13.7/177.3)=7.7%，而男性比女性高100%×(13.7/163.6)=8.4%。

由于使用的分母不同，导致两个相对差异百分比存在差异，而绝对差异则不存在这个问题：女性比男性低13.7 cm，男性比女性高13.7 cm，结果是对称的。

有时何者更适合做分母比较容易判定。例如，在同一时间轴上的两个测量值，以第一个数据做分母更合适，那么相对差异就是随时间变化的百分比。

但是，在很多情况下，哪个做分母更合适并不显而易见，即哪个做分母都可以接受，或者都不令人满意。男女身高的相对差异百分比究竟是多少，7.7%和8.4%，两个都不对，其中之一是对的，或是两个都对？

当绝对差异很小时，无论哪个做分母问题都不大，相对差异百分比会非常接近。例如，11岁儿童的平均身高，女孩比男孩高0.523%，男孩比女孩低0.520%。

但是，随着绝对差异变大，不同方法计算的相对差异百分比会存在很大差别。例如，一对身高差异很大的夫妇身高分别为188 cm和94 cm，相差94 cm。丈夫比妻子高100%，而妻子比丈夫矮50%。

这个极端案例突显了此种算法可能带来的混淆。因此，一个更常用的算法（算法2）是用两个对比数据的平均值做分母：相对差异百分比=100%×(两个数据的绝对差异/平均值)。

再以这对身高差别很大的夫妇为例。其平均身高为(188+94)/2=141 cm，则相对差异百分比为100%×(94/141)=66.7%，介于算法1中的两个相对差异百分比的中间，而且如果交换对比基线，相对差异百分比分别为+66.7%或-66.7%，绝对值相等，正负对称，这样就与绝对差异（+94cm或-94cm）的对称性保持一致。

但需要注意的是，均值的计算方法有很多种，如几何均数、调和均数和算术均数，如果用几何均数或调和均数代替上述的算术均数，则会得到不同的相对差异百分比。

另外，算法1还有另一个问题——不可加性。比如，一个早产儿体重每周增加10%，连续观察2周，你可能会错误地认为体重共增加了2×10%=20%，而实际上是增加了21%。同理，如果他的体重第1周增加10%，第2周下降10%，二者不会抵消，最终的体重实际是初始体重的99%，降了1%。

这些例子表明，算法1既不对称也不可相加。用平均值做分母的算法2实现了对称性，但仍不能解决可加性问题。

相对差异百分比的问题在使用其他指标时也会出现，如标准差和回归系数。

参考文献：BMJ 2017; 358 doi: https://doi.org/10.1136/bmj.j3663 （中文翻译仅供参考，所有内容请以英文原文为准）

李戈

刘欣月译

天津中医药大学健康科学与工程学院

孙凤校

北京大学公共卫生学院流行病与卫生统计学系

（唐金陵推荐并改编）

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴