死亡并不是一个让人喜欢的词,于高龄人口而言,更是如此。
来自人口普查的数据显示:人年龄越大,死亡的可能越大。
人口普查使用一项叫死亡率的指标,来描述不同年龄段的死亡情况,计算方法为:当年死亡人口除以当年存活的人口X100。
以第七次全国人口普查(数据统计时间为2019年11月1日-2020年10月1日)数据为例,当年全国14.09亿人口,死亡人口797万,所以死亡率为5.66%。
在不同的年龄段,这一指标有比较大的变化,基本随年龄的增长而增大,与开篇所说基本一致。
不区分性别的话,0-4岁为0.47%,5-9岁为0.14%,20-24岁为0.33%,40-44岁1.25%,70-74岁为20.26%,100岁以上为237.43%。
更多年龄的这一指标(包括不区分性别、男性和女性三个分类),你可以在国家数据发布的《中国人口普查年鉴2020》中找到,无须重复抄录。
但显然,这个指标并不是更多人所关心的,采用存活人口除以出生人口,才是更多人想知道的结果,这一点,前面我们已经分享过。
数据分析的价值之一,是要从数据中找到一些规律,不管这些规律是被我们已知的,还是尚未被人发现的。
2020年的死亡人口,一定程度上受2020-2022事件的影响,但考虑到人口普查时这件事的影响范围并不是很大,所以可以认为数据是稳定且少有波动的。
2000年以来,死亡人口的年龄分布,有何变化呢?这是今天我们要从这组死亡人口数据中挖掘的信息。
图表中,我们用不同的填充色,分别表示10%、20%、30%等分位值所在区间范围,以方便大家在更短的时间内找到数据分布的规律。
50%分位值,是我们更关心的,即大家所说的平均年龄。
有网友肯定会说,50%分位值是中位数,我是知道的,为何又说它是平均年龄呢?
因为人活到100岁以上的概率极低,所以人的年龄这一样本中,最大值(120岁差不多是极限值,不可能是300岁或3000岁)与最小值(0岁)的差异并不会过大。中位数与平均数,在此处的区别并不会太大,可以通用。
而工资这一样本中,最大值可能上亿,最小值可能只有区区几千,所以此时中位数与平均数,差异会比较大,中位数更能反映中间位置的数据。
50%分位值在哪里?图表中金黄色与绿色交界的地方,2000年这一指标为67岁、2010年为70岁、2020年上升到72岁。
一句话总结:这种平均死亡年龄的提升,显然是社会经济正向发展时医疗、生活、劳动、环境等因素综合提高的结果。
于高龄人口而言,2020年,全国男性中,有10%的人,在87岁以后去世。2000年,这一比重为82岁,二十年来整整提高了5岁。
比这些进步更大的,是年轻人口死亡比例的下降。
2000年,全国当年去世的人口中,有大约10%的人口在28岁以前去世。2020年,这一比例的年龄提高到50岁。
有网友仍然相信这是2020年事件对高龄人口的影响,请看2010年数据。
2010年当年全国去世的人口中,10%的人口在42岁以前去世,这也比2000年时提高了15岁。
短短二十年的变化表明,这恐怕是过去五千年最好的时代。
热门跟贴