R语言入门秘录12/25:均值置信区间

数据分析网整理自tbkken的《R语言入门25招》,一招招技能带你走进R语言。

问题

有来自群体的样本。根据样本推断该群体均值的置信区间。

解决方案

用t.test函数处理样本x:

代码

> t.test(x)

函数的输出包括95%可信度的置信区间。可以用conf.level参数调整可信度,查看其他可信度的区间。

如果样本数量n比较小,那么就只有在整个群体服从正太分布的情况才会得到有意义的置信区间。通常可以认为n<30就是样本数较少了。

讨论

用t.test函数处理向量输出的内容不少。其中重要的是置信区间:

代码

> x <- rnorm(50, mean=100, sd=15)

> t.test(x)

One Sample t-test

data: x

t = 59.2578, df = 49, p-value < 2.2e-16

alternative hypothesis: true mean is not equal to 0

95 percent confidence interval:

97.16167 103.98297

sample estimates:

mean of x

100.5723

在这个例子中,置信区间约为97.16 < μ < 103.98,也可以简写成(97.16, 103.98)。

可以通过设置conf.level=0.99将置信水平提高到99%:

代码

> t.test(x, conf.level=0.99)

One Sample t-test

data: x

t = 59.2578, df = 49, p-value < 2.2e-16

alternative hypothesis: true mean is not equal to 0

99 percent confidence interval:

96.0239 105.1207

sample estimates:

mean of x

100.5723

这样就将置信区间扩大到96.02 < μ < 105.12。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

(1)
上一篇 2016-01-05 13:55
下一篇 2016-01-07 14:31

相关文章

关注我们
关注我们
分享本页
返回顶部