系列简介
这是我们一系列原创技术贴,从易到难,每天学习一点。所有内容均为疾控数据分析、科研论文相关,或者说很多和现在的热门监测预警相关,所以我们这个系列就叫“监测预警基础”。
今天是第19节,在上一节我们讲了回归基本理论的基础上,讲一下回归最简单的操作,以便后续内容的开展。
我们这节课的主要目的还是为后面的Serfling回归模型打基础。
当然了,本身回归我们就是经常会用到的,尤其是如何在excel和SPSS这种易于操作的软件中进行更是疾控人必须掌握的技能。
首先,在excel中进行回归分析不一定所有的软件都可以,如【分析】选项中不存在【数据分析】选项就不行,需要进行设置才可以,设置步骤如下,也很简单,设置了之后你的excel不只可以做回归分析,还可以进行以下很多统计分析。
1.设置步骤如下:
点击【文件】主模块,在弹出的对话框中用鼠标单击【选项】按钮。
在弹出的【Excel选项】对话框的列表中点击【加载项】选项,然后点击对话框最下方的【转到】按钮。
在弹出的【加载项】对话框中勾选【分析工具库】,点击确定;
点击excel软件中【数据】主模块,找到【分析】选项,点击【数据分析】就可以进行相应的统计分析了。
2.用excel做简单线性回归
假设我们有这样2个变量的数据
点击“数据”选项卡,然后点击“数据分析”;
选择“分析工具“中的”回归“,然后点击”确定“按钮;
在”Y值输入区域“中输入因变量y的数据范围,在”X值输入区域”中输入自变量x的数据范围;
如果选中的数据第一行是变量名而非数值,则勾选“标志”复选框,否则无需勾选。
好了,点击之后就可以输出结果
我们对结果的解读如下,很仔细了。
当然,对于简单线性回归来说我们还是要说一下,做一个趋势性,然后显示公式,其常数项和回归系数其实我们也就知道了。
3.用excel做多元线性回归
在excel中进行多元线性回归其实和简单线性回归的方式一模一样,只是在选择数据自变量的之后,简单线性回归是只有一列,而多元线性回归就是纳入多列。
结果输出也是一样,在回归系数这个表中,如下图,会依次给出各个自变量的回归系数和统计检验值。
但是我们得说明一点,excel中,如果出现缺失值,比如下图自变量3出现几个缺失值,是无法进行回归分析的。
相比Excel,用SPSS进行回归分析可以做更多的统计,当然,回归方式也很多。
比如我们熟知的logistic回归分析,就是我们在SPSS中进行会进行的,今天我们的重点不是SPSS各种回归方式介绍,避免跑题,我们也就不多说,只说和我们线性回归。
1.SPSS做简单线性回归
准备好需要分析的数据,依次点开:
分析(Analyze)→回归(Regression)→ 线性(L)
2.SPSS简单线性回归中的分层回归(层次回归)
本质上是建立在回归分析基础上,区别在于分层回归可分为多层,用于研究两个或者多个回归模型之间的差异。分层回归将核心研究的变量放在最后一步进入模型,以考察在排除了其他变量的贡献的情况下,该变量对回归方程的贡献,如果变量仍然有明显的贡献,那么就可以做出该变量确实具有其他变量所不能替代的独特作用的结论。
这种方法主要用于,当自变量之间有较高的相关,其中一个自变量的独特贡献难以确定的情况。常用于中介作用或者调节作用研究。
其他结果不再赘述,详情看第一部分的分析结果。
3.逐步回归
逐步回归分析方法的基本思路是自动从大量可供选择的变量中选取最重要的变量,建立回归分析的预测或者解释模型。其基本思想是:将自变量逐个引入,引入的条件是其偏回归平方和经检验后是显著的。
同时,每引入一个新的自变量后,要对旧的自变量逐个检验,剔除偏回归平方和不显著的自变量。这样一直边引入边剔除,直到既无新变量引入也无旧变量删除为止。它的实质是建立“最优”的多元线性回归方程,可利用逐步回归筛选并剔除引起多重共线性的变量。
其他结果不再赘述,详情看第一部分的分析结果。
好了,最后我们还有一个重点要说,和EXCEL不一样,SPSS中当部分变量出现缺失值时,他依然可以进行回归分析。
编辑:普通疾控人 | 审核:诗酒趁年华
文章来源 | 原创
说明 | 转载只为分享,如有侵权联系删除
©版权声明 | 部分信息和图片来自公开网络
转载请注明
再次转载请注明出处
科普健康 | 宣传疾控
本号为多位疾控机构从业者运营
重点关注国内外健康事件
致力于疾控科普
在做好科普服务大众的同时
做好疾控机构的宣传
让更多的人了解疾控,拥抱健康
欢迎加「小编」微信(cdcjkr126com)
本文具体说明
本文为原创内容,文章为个人理解所学,不涉及疫情信息及内部保密数据,发表的目的为自我总结及给有需求的人士学习使用。如有不妥之处,欢迎联系小编修改、删除。
更多精彩视频,尽在“CDC疾控人”视频号
热门跟贴