作者:申杰
毕业于华中科技大学同济医学院公共卫生学院;教授,硕士研究生导师
中国中西医结合学会营养专业委员会副主任委员
《临床营养网》顾问
河南中医药大学公共卫生与预防医学学科开创人(原学科带头人、学科主任)
河南中医药大学预防医学专业(营养与食品卫生方向)创办人研究方向:营养及食疗药膳基础理论研究,流行病学及统计学应用研究。
本文摘选自:《临床营养管理——基础、技能与案例》,化学工业出版社 P076-080
统计学(statistics)是处理数据中变异性和复杂性的科学和艺术,其目的是探索事物的内 在数量规律性,以达到对客观事物的科学认识。唯有培养用数据说话的科学态度,将数据素 养、统计思维转化为数据分析与应用能力,方能挖掘数据背后的真相——事物发展的规律。
一、统计学的相关概念
1. 统计的含义
(1)统计工作(statistical work) 是统计设计、数据搜集、整理和分析的总称。
(2)统计数据(statistical data) 是统计工作过程中所取得的数字资料以及与之相联系的其他资料的总称。
(3)统计学(statistics) 分为数理统计学和应用统计学。数理统计学研究的是统计学的数学基础。应用统计学又分为描述统计学和推断统计学。
2. 统计工作的基本内容 归纳为下述三个部分,见表7-1。
(1)统计设计(statistical design) 制订相关的数据分析计划,对需要研究的数据进行有效的分析。目的在于保证研究结果的经济性、可重复性和科学性。
(2)统计描述(statistical description) 用统计指标、统计图、统计表等描述样本资料的数据特征及其分布规律,是统计推断的基础与前提。
(3)统计推断(statistical inference) 包括参数估计(estimation of parameter)和假设检验 (hypothesis testing),是利用样本信息,根据一定的概率水准,推断指标间的差异有无统计学意义的分析方法,其本质是一种决策的概率思想与反证法。
表7-1 临床营养统计工作的基本内容
3.统计工作的基本步骤
(1)统计设计(statistic design) 主要是从统计学的角度对研究设计类型、对照设置、随 机(抽样分组与分配)方案、样本含量估计、数据分析方法选用、误差控制等方面进行考量,目的是控制误差,保证研究成果的科学性、可靠性、重复性和经济性。
(2)数据搜集(data collection) 主要收集两类数据:①可直接获取的数据;②经过加工整理后得到的数据。
(3)数据整理(data sorting) 对搜集到的各种原始数据进行清理、纠错、转化、建库与存储,以便于进行数据分析。
(4)数据分析(data analysis) 是指运用适宜的数据分析方法与模型对数据进行综合、推理、判断等思维活动的过程。目的是发现数据中的内部关系与规律。
4.变量和变量值
(1)变量(variable) 指观测对象的某个特征,又称观察指标。通常用数字、字母或其他符号代表观察单位(对象)的某一项特征或属性。常见的变量类型见表7-2。
(2)变量值(value of variable) 变量的观察结果或测定值。
5. 总体与样本
(1)总体(population) 根据研究目的确定的同质观测单位的集合,总体内个体数值的分布称为总体分布(population distribution)。总体可分为以下两类。
①无限总体(infinite population)。无空间、时间和人群范围的限制,其观测单位的全体数值是理论上存在的。
②有限总体(finite population)。特定空间、时间与人群范围内的有限个观测单位。
(2)样本(sample) 从统计总体中随机抽取的、具有代表性的(representative)部分观测单位的集合。样本所包含的观测单位数为样本量(sample size),用小写拉丁字母n表示。
6.统计量(statistic)与参数(parameter) 统计学将描述样本特征值的指标称为统计量,如样本均数、样本率、样本相关系数等,一般用小写英文字母x、p、r等表示;将描述总体特征值的指标称为参数,如总体均数、总体率、总体相关系数等,一般用小写希腊字母μ、π、ρ等表示。
7.事件(event) 泛指事物发生的某种情况或在调查、观察和实验中获得的某种结果, 分为以下三类。
(1)确定性事件(certainty event) 包括事件的概率为1的必然事件(certain event)和事件的概率为0的不可能事件(impossible event)两种类型。
(2)随机事件(random event) 指事件的结果不确定,是可能发生也可能不发生的不确定性事件。
(3)模糊事件(fuzzy event) 指事物本身的定义不确定。如“健康”与“不健康”,“年轻” 与“年老”。研究这类现象的工具是模糊数学。
8. 频率、概率与小概率事件
(1)频率(frequency) 指某种现象发生的次数。对于随机事件A,在相同的条件下进行了n次实验,事件A发生的次数为m,比值m/n为频率,记为fn(A)。医学常用的患病率、病死率等均为频率。
(2)概率(probability) 描述某随机事件A发生的可能性的大小,记为P(A)。当n→∝时, 频率fn(A)→概率P(A),统计符号为P,P的取值范围为0≤P≤1。
(3)小概率事件 习惯上将P≤0.05、P≤0.01的事件称为小概率事件(但不是不可能事 件),统计学认为小概率事件在一次抽样中是不可能发生的。
9. P与P值 P是概率的统计符号。在假设检验的结论中,P值(P-value)是作出专业结论的重要依据,表示差异来自抽样误差的可能性,而不是差别的大小。P值越小说明两个样本来自同一总体的可能性越小,而不能说明两组间差别越明显。
10. α水准与检验效能 是统计推断时预先规定的概率值,在假设检验中称α为检验水准,表示发生I型错误(假阳性率)的概率;在参数估计中称α为信度。1-β 称为检验效能或把握度,其含义是:当两个总体确有差别时,按规定的检验水准α 能够发现该差别的能力。
二、统计观念与统计思想
1. 统计观念(statistics conception) 是指由一组数据所引发的想法,推测到可能的结果,自觉地想到运用统计的方法解决有关的问题等。主要有三层含义:①数据的收集、记录和整理能力;②对数据的分析、处理并由此作出解释、推断与决策的能力;③对数据和统计信息能作出良好判断的能力。形成统计观念的基本构成要素如下。
(1)统计思维 是用最小的风险、最低的成本、最高的信度得到最大的效益。统计思维是掌握数据分析方法的前提和基础,灵敏的统计思维可更快、更准确地掌握各种数据分析方法。
(2)数据分析 是统计思维深入发展的支撑和保障,越来越成为一项必不可少的技能。统 计思维和数据分析方法是构成统计观念的内隐要素,批判意识和辨别能力则是构成统计观念的外显要素。
(3)批判意识与辨别能力 主要体现在对数据的来源、处理数据的方法及相关信息与结论进行合理的质疑与批判。是否具有反思和批判意识是衡量科学精神与统计观念强弱的标志。
2. 统计思想 是在统计工作中应该树立的世界观和方法论。主要体现在以下几个方面。
(1)均值思想 要求从总体上看问题,观察其一般发展趋势,避免个别偶然现象的干扰, 体现了总体观、数量观和推断观。
(2)概率思想 数据分析结论中没有“证明”,只有在一定概率水平上的推论。小概率原 理是统计推断的核心与基础。 假设检验是反证法与小概事件原理相结合的体现。
(3)误差控制思想 主要体现在统计设计“四原则”。 此外,数据分析时需考虑统计学的 I 类和II类错误,方能在最大限度上推测总体的真实情况。
参考文献:略。
《中国临床营养网》编辑部
本站动态栏:
截止到 2024 年 1 月 30 号上午 8:00 时,本平台关注人数为:364411 名。更多信息点击左下角阅读原文查看。
热门跟贴