打开网易新闻 查看精彩图片

从今天开始,我们专注发一系列的技术贴!

从易到难,每天学习一点,所有内容均为疾控数据分析、科研论文相关,或者说很多和现在的热门监测预警相关,所以我们这个这个系列就叫“监测预警基础”。

作为疾控工作者或者公卫人,我们经常听到时间序列数据分析。那么,究竟什么是时间序列数据?我们一般会如何分析它呢?

今天一探究竟


打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

时间序列数据是按照时间顺序收集、记录的一系列观测值,其中时间是一个关键维度,其核心价值在于利用历史中的时间模式来理解现在、预测未来

在疾控领域,时间序列数据就可以理解为时间序列数据是按照固定时间间隔收集的、反映疾病发生、发展及防控效果的一系列观测值,时间顺序具有明确的流行病学意义。比如大疫情的发病数据、比如ILI%这样的监测数据、比如防控措施数据以及每日温湿度等其他相关因素数据。

时间序列数据最本制度的特征是时间依赖性,也就是说相邻观测值之间存在相关性,现在的值受过去值的影响,这也是与横截面数据最本质的区别

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

时间序列通常由以下4个组成部分构成。

第一、趋势指时间序列在较长一段时间内呈现出来的持续向上或者持续向下的变动

第二、季节性在一年内重复出现的周期性波动,如气候条件、生产条件、节假日等

第三、周期性:一年以上的非固定周期的波动。

第四、不规则波动也就是残差,指除去趋势、季节性、周期性外的随机波动、随机噪音,核心是 “无规律、突发且影响小”。不规则波动通常总是夹杂在时间序列中,致使时间序列产生一种波浪形或震荡式的变动。只含有随机波动的序列也称为平稳序列。

一句话总结:时序数据 = 趋势(长期方向) + 季节(固定短周期波动) + 周期(长期循环波动,有大致范围) + 残差(随机小波动)。也不定包括全部4部分,比如平稳数据只有 “残差波动”,趋势型数据是 “趋势 + 残差波动”。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

时间序列数据可以用数学模型分解

第一种方式:加法模型。当趋势和季节性变化独立作用时,季节性波动的幅度不随时间变化时,加法模型是合适的。

打开网易新闻 查看精彩图片

  • Yₜ:时间t的观测值

  • Tₜ:趋势成分

  • Sₜ:季节成分

  • Cₜ:周期成分

  • Iₜ:不规则成分

第二种方式:乘法模型。当季节性效应的大小取决于趋势的大小、季节性波动的幅度随趋势增长而变化时,采用乘法模型。

打开网易新闻 查看精彩图片

作为疾控人,其实我们接触最多的时间序列数据就是发病数据,其实相应的,对于发病数据可以进行更详细的分解,如下所示:

打开网易新闻 查看精彩图片

至于以上数据模型分解有什么意义,在这先不做详细解释,后面在我们介绍时间序列数据的分析中自然会讲到,在这只需要有个初步概念就行。

打开网易新闻 查看精彩图片

我们一般会使用时间序列数据做以下分析:
第一、描述分析:比如采用时序图进行可视化分析,识别趋势、季节性,计算基本统计量 。
第二、分解分析:分离趋势、季节、周期、随机成分单独分析,比如季节指数计算、或者趋势的各种简单或者复杂的预警模型等。
第三、预测分析:基于历史数据预测未来,比如采用传统时间序列模型ARIMA模型、指数平滑等。
第四、因果关系分析:分析变量间的领先滞后关系、格兰杰因果检验等。
也是一样,在实际例子中具体如何操作和使用,在后续的分析推文中我们会讲解到。

打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片

编辑:普通疾控人 | 审核:诗酒趁年华

文章来源 | 原创

说明 | 转载只为分享,如有侵权联系删除

©版权声明 | 部分信息和图片来自公开网络

转载请注明

再次转载请注明出处

打开网易新闻 查看精彩图片

科普健康 | 宣传疾控

本号为多位疾控机构从业者运营

重点关注国内外健康事件

致力于疾控科普

在做好科普服务大众的同时

做好疾控机构的宣传

让更多的人了解疾控,拥抱健康

欢迎加「小编」微信(cdcjkr126com)

本文具体说明

本文为原创内容,文章为个人理解所学,不涉及疫情信息及内部保密数据,发表的目的为自我总结及给有需求的人士学习使用。如有不妥之处,欢迎联系小编修改、删除。

更多精彩视频,尽在“CDC疾控人”视频号

打开网易新闻 查看精彩图片