1. 数据分析网首页
  2. 大数据
  3. 统计学

小白学统计(32)估计理论:详述总体均值的单样本估计原理

基础准备

推断性统计学是统计科学的一部分,它提供了从样本特征对整个总体特征做出推断的逻辑和方法。推断性统计学在理论上有4个组成部分:概率论、抽样理论、估计理论和假设检验理论。这篇讲述估计理论在总体均值的单样本估计中的应用。

概率论:小白学统计(7)——推断理论基础(概率)

抽样理论:

小白学统计(24)推断性统计学:抽样设计

小白学统计(25)通俗解释“大数据”及推断性统计学:抽样分布

小白学统计(27)抽样分布:详述均值的抽样分布及中心极限定理

小白学统计(28)抽样分布:t分布

估计理论

估计理论提供了从样本统计量估计未知总体参数的方法。样本统计量是某些测量值样本特征的经验性数值量度,不能将样本的经验抽样分布与样本理论抽样分布及总体概率分布混淆。

两个概念

估计量:指任何一个对总体参数给出估计值的样本统计量,例如样本均值。

估计值:指从某一样本计算得到的估计量的一个具体数值。

点估计

对于来自一个测量总体的任何随机样本,如果对随机量(例如:样本的均值、方差或标准差)算得一个具体的数值(某个样本的均值、方差或标准差),用以估计总体的参数(例如:总体的均值、方差或标准差),则该数值称为总体参数(例如:总体的均值、方差或标准差)的一个点估计。

用点估计反映总体参数时,应该给出尽可能多的附加信息,使得便于评价估计值的准确度和精度。准确度受度量方法和抽样设计影响;精度则由固定容量n的样本标准差决定,标准差越小越精确。

尽管有点估计及其准确度和精度的一些信息,但是仍然未能从样本跳跃到总体,即未能把点估计与待估总体参数联系起来,给出估计对参数的接近程度或确定在估计值中存在多大的可能误差,为了从样本信息推断总体参数,需要用到区间估计

区间估计

区间估计是一个从样本到总体的推断,区间估计将总体参数置于一个实区间上。区间的边界值由三个因素决定:

1、样本点估计值;

2、联系总体参数和样本点估计的样本统计量(如Z统计量,做正态变换得到);

3、该统计量的抽样分布(例如,样本均值的理论抽样分布服从正态分布,则Z统计量的抽样分布是标准正态分布);

总体均值的区间估计公式推导

小白学统计(32)估计理论:详述总体均值的单样本估计原理
小白学统计(32)估计理论:详述总体均值的单样本估计原理



上述推导给出了总体均值的区间估计的概率形式,基于要求:容量为n的单样本来自无限大且标准差已知的正态分布总体。

置信水平

在进行数据分析时,经常需要输入置信水平,大多数情况选择95%的置信水平,当然也可以选择其他的置信水平。什么是置信水平呢?通过上面的公式推导,得到了总体均值区间估计的概率表示:

小白学统计(32)估计理论:详述总体均值的单样本估计原理


其中的1-α称为置信系数,它的百分数表示形式(1-α)100%称为置信水平。

例题分析

社会学家正在研究居住在乡村的10-12岁儿童的看电视习惯,从N=39200个乡村儿童中无放回抽取n=50个儿童作为随机样本,得到每周看电视的平均时间为12.5小时,假设儿童每周看电视时间的总体服从正态分布,且标准差为2.2小时,则儿童每周平均看电视时间μ的96%置信区间是多少?

小白学统计(32)估计理论:详述总体均值的单样本估计原理

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

联系我们

如有建议:>>给我留言

QR code