1. 数据分析网首页
  2. 大数据
  3. 统计学

什么是方差?

方差是各个数据与其算术平均数的离差平方和的平均数,通常以σ2表示。

什么是方差(Variance)?

方差和标准差是测度数据变异程度的最重要、最常用的指标。

方差是各个数据与其算术平均数的离差平方和的平均数,通常以σ2表示。方差的计量单位和量纲不便于从经济意义上进行解释,所以实际统计工作中多用方差的算术平方根——标准差来测度统计数据的差异程度。

标准差又称均方差,一般用σ表示。方差和标准差的计算也分为简单平均法和加权平均法,另外,对于总体数据和样本数据,公式略有不同。

方差的计算公式

设总体方差为σ2,对于未经分组整理的原始数据,方差的计算公式为:

sigma^2=frac{sum_{i=1}^N(X_i-bar{X})^2}{N}

对于分组数据,方差的计算公式为:

sigma^2=frac{sum_{i=1}^K(X_i-bar{X})^2 f_i}{sum_{i=1}^K f_i}

方差的平方根即为标准差,其相应的计算公式为:

未分组数据:sigma=sqrt{frac{sum_{i=1}^N(X_i-bar{X})^2}{N}}

分组数据:sigma=sqrt{frac{sum_{i=1}^K(X_i-bar{X})^2 f_i}{sum_{i=1}^K f_i}}

样本方差和标准差

样本方差与总体方差在计算上的区别是:总体方差是用数据个数或总频数去除离差平方和,而样本方差则是用样本数据个数或总频数减1去除离差平方和,其中样本数据个数减1即n-1称为自由度。设样本方差为S_{n-1}^2,根据未分组数据和分组数据计算样本方差的公式分别为:

未分组数据:S_{n-1}^2=frac{sum_{i=1^n(x_i-bar{x})^2}}{n-1}

分组数据:S_{n-1}^2=frac{sum_{i=1^k(x_i-bar{x})^2 f_i}}{sum_{i=1}^k f_i-1}

未分组数据:S_{n-1}=sqrt{frac{sum_{i=1^n(x_i-bar{x})^2}}{n-1}}

分组数据:S_{n-1}=sqrt{frac{sum_{i=1^k(x_i-bar{x})^2 f_i}}{sum_{i=1}^k f_i-1}}

例:考察一台机器的生产能力,利用抽样程序来检验生产出来的产品质量,假设搜集的数据如下:

3.43 3.45 3.43 3.48 3.52 3.50 3.39
3.48 3.41 3.38 3.49 3.45 3.51 3.50

根据该行业通用法则:如果一个样本中的14个数据项的方差大于0.005,则该机器必须关闭待修。问此时的机器是否必须关闭?

解:根据已知数据,计算bar{x}=frac{sum x}{n}=3.459

S^2=frac{sum(x-bar{x})^2}{n-1}=0.002<0.005

因此,该机器工作正常。

方差和标准差也是根据全部数据计算的,它反映了每个数据与其均值相比平均相差的数值,因此它能准确地反映出数据的离散程度。方差和标准差是实际中应用最广泛的离散程度测度值。

本文为 数据分析网 原创文章,转载或内容合作请联系我们,未经允许谢绝转载,本文链接:https://www.afenxi.com/25897.html 。

发表评论

登录后才能评论

联系我们

如有建议:>>给我留言

QR code