在这个部分,我们要学习使用 R 编程语言汇总数据的不同统计方法。
算数平均数
算术平均数是指在一组数据中,所有数据之和再除以数据的个数。它是反映数据集中趋势的一项指标。
![](http://dingyue.ws.126.net/2022/0804/62d17c3bj00rg2uer000md000i000bdp.jpg)
打开网易新闻 查看精彩图片
中位数
中位数是将数据样本的上半部分与下半部分分开的中间值。
![](http://dingyue.ws.126.net/2022/0804/2ec2b644j00rg2uis0009d000i2005lp.jpg)
打开网易新闻 查看精彩图片
众数
数据集中出现频率最高的值。
![](http://dingyue.ws.126.net/2022/0804/e32ff4cdj00rg2ujl000fd000i3006up.jpg)
打开网易新闻 查看精彩图片
范围
一组数据的范围是最大值和最小值之间的差。
![](http://dingyue.ws.126.net/2022/0804/dbdf3dbfj00rg2uk60008d000i6004sp.jpg)
打开网易新闻 查看精彩图片
四分位数
将所有数值按大小顺序排列并分成四等份,处于三个分割点位置的得分就是四分位数。
最小的四分位数称为下四分位数,在所有数值中,有四分之一小于下四分位数,四分之三大于下四分位数。中点位置的四分位数就是中位数。最大的四分位数称为上四分位数,在所有数值中,有四分之三小于上四分位数,四分之一大于上四分位数。
Q1=第1四分位数,即第25百分位数;Q2=第2四分位数,即第50百分位数;Q3=第3四分位数,即第75百分位数。
![](http://dingyue.ws.126.net/2022/0804/7a964b09j00rg2udr000vc000jg008em.jpg)
打开网易新闻 查看精彩图片
![](http://dingyue.ws.126.net/2022/0804/eb59cae7j00rg2ukn000hd000ib0079p.jpg)
打开网易新闻 查看精彩图片
四分位距
四分位距能粗略地表示数据集中间50%的数据的离散程度。它可以计算为第三四分位数 (Q3) 减去第一个四分位数 (Q1)。
![](http://dingyue.ws.126.net/2022/0804/c78cad8aj00rg2uli000hd000ia0098p.jpg)
打开网易新闻 查看精彩图片
方差
衡量一组数字与其平均值的距离。
![](http://dingyue.ws.126.net/2022/0804/470b9576j00rg2ulw000ad000i3005jp.jpg)
打开网易新闻 查看精彩图片
标准差
用于量化一组数据值的变化程度或离散程度的度量。
![](http://dingyue.ws.126.net/2022/0804/82c58fb2j00rg2um9000bd000im005mp.jpg)
打开网易新闻 查看精彩图片
五数概括法
提供有关数据集信息的一组描述性统计数据,包括最小值、第1四分位数、中位数、第3四分位数和最大值。
![](http://dingyue.ws.126.net/2022/0804/9bc12b78p00rg2umm0005d000i70038p.png)
打开网易新闻 查看精彩图片
箱形图
一种基于五数概括法的数据描述统计图。
![](http://dingyue.ws.126.net/2022/0804/0043774dp00rg2un00003d000hw0024p.png)
打开网易新闻 查看精彩图片
![](http://dingyue.ws.126.net/2022/0804/862272c3j00rg2udr0005c000iv00a5m.jpg)
打开网易新闻 查看精彩图片
热门跟贴