1. 数据分析网首页
  2. 大数据
  3. 统计学

小白学统计(6)——统计资料的图形描述(几何图)

小白学统计(6)——统计资料的图形描述(几何图)

所谓几何图就是利用几何图形的线形、长度、面积或体积等长短或大小变化来表示统计资料的图形。主要有散点图、条形图、直方图、饼形图、线形图和累计图等。

散点图(Scatter Chart),也称XY图,用于比较成对的数值,是用不同位置的点来描述数据的一种图形。它经常被用来研究两种变量之间的相关关系,是探索数据之间的关系形态及关联程度常用的一种图形,它通常用于比较跨类别的聚合数据,对于处理值的分布和数据点的分簇,散点图都很理想。如果数据集中包含非常多的点(例如,几千个点),那么散点图便是最佳图表类型。下图是用储蓄率与老人占人口的比重绘制的散点图。可以看出储蓄率与老人占总人口的比重具有较高的相关性程度。且呈现一种亚相关的比例关系。

小白学统计(6)——统计资料的图形描述(几何图)

条形图(Bar Chart)是用宽度相同的条形的高低或长短来表示数据变动特征的。图形宽度不表示数据大小,只要选择与高度成恰当比例即可。使用条形图的主要目的是用于对比,可以比较不同时间、不同地区、不同种类统计数据之间的差别,其具体表现方法有纵置式、横置式,有单条式也有复条式和分段式。

小白学统计(6)——统计资料的图形描述(几何图)

直方图(Histograms)也是用条形来说明统计资料的。它与条形图的区别是:绘制直方图的数据必须是定量数据,即它的横坐标应是连续的定量变量,而不能像条形图那样间隔排列。因此,直方图的条形宽度是由数据决定的,而不像条形图那样由美观决定。直方图也是用于对比的,但主要是用来比较分组资料间的数据差距的,或者说是比较数据的分布状况。下图是一个学生身高的直方图。

小白学统计(6)——统计资料的图形描述(几何图)

因为直方图的纵横轴都为数字,所以严格来说,直方图是通过条形的面积来反映统计资料的,而不仅仅是高度。数据如果是等距分组,因各组距离相等,因此条形的宽度也是相等的,条形的高度就可以直接用来比较。但是,如果数据是异距分组,则不能直接使用高度来比较,否则会引起歧义。

饼形图(Pie Chart)是以图形面积的的大小、圆内扇形个数多少或圆内各扇形面积大小来表示统计资料的图形。该图形主要用于描述数据内部的结构,有时也用于比较。圆内扇形面积的划分是根据圆的面积公式来计算。

小白学统计(6)——统计资料的图形描述(几何图)

线性图是利用曲线的升降来说明定量变量数据的图形。它具有绘制简便、显示资料直观等特点,在实践中有着广泛的应用。线性图的种类很多,下面介绍两种经常使用的线性图形。

(1)动态曲线图,动态曲线图就是将数据按照实践变化的先后顺序,用点、线连接的方法绘制的线形图。主要用来放映在一段时间内数据发展变化的情况。

小白学统计(6)——统计资料的图形描述(几何图)

(2)频数分布图。频数分布图是用曲线的升降高低表明数据的分布特征。图形的纵坐标可以是频数也可以是频率,横坐标是分组的变量。在进行分析和研究数据特征时,经常绘制频数分布图来表示数据的集中趋势和偏度。

小白学统计(6)——统计资料的图形描述(几何图)

累计图可以直接说明“大于”或者“小于”某值的数据有多少。在累计分布中应用最广泛的就是洛伦茨曲线。是美国经济、统计学家洛伦茨根据意大利经济学家柏拉图提出的收入分配公式绘制成的描述收入和财富分配性质的曲线,见下图:

小白学统计(6)——统计资料的图形描述(几何图)

图中横轴是累计的人口百分比,纵轴是累计的收入或财富百分比。显然,如果一个国家的收入分配完全是相等的,此时,收入分配曲线就是绝对平均线——对角线。如果某国绝大多数人口占有很少的财富和收入,而一少部份人占有了绝大部份的收入,则该国的收入分配曲线就会成为初始缓慢上升而后急速上升的曲线。

为了更准确的反映收入分配的变化程度,意大利经济学家基尼根据洛伦茨曲线给出了衡量收入分配平均程度的指标——基尼系数,表示为

小白学统计(6)——统计资料的图形描述(几何图)

其中A表示实际收入曲线与绝对平均线之间的面积,B表示实际收入曲线与绝对不平均线之间的面积。如果A=0,则基尼系数为0,表示收入绝对平均;如果B=0,则基尼系数为1,表示收入绝对不平均。基尼系数一般在0和1之间取值,系数越小,收入分配越平均。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

发表评论

登录后才能评论

联系我们

如有建议:>>给我留言

QR code