R语言入门秘录12/25：均值置信区间

小胖 • 2016-01-06 14:29 • R-project

问题

有来自群体的样本。根据样本推断该群体均值的置信区间。

解决方案

用t.test函数处理样本x：

代码

> t.test(x)

函数的输出包括95%可信度的置信区间。可以用conf.level参数调整可信度，查看其他可信度的区间。

如果样本数量n比较小，那么就只有在整个群体服从正太分布的情况才会得到有意义的置信区间。通常可以认为n<30就是样本数较少了。

讨论

用t.test函数处理向量输出的内容不少。其中重要的是置信区间：

代码

> x <- rnorm(50, mean=100, sd=15)

> t.test(x)

One Sample t-test

data: x

t = 59.2578, df = 49, p-value < 2.2e-16

alternative hypothesis: true mean is not equal to 0

95 percent confidence interval:

97.16167 103.98297

sample estimates:

mean of x

100.5723

在这个例子中，置信区间约为97.16 < μ < 103.98，也可以简写成(97.16, 103.98)。

可以通过设置conf.level=0.99将置信水平提高到99%：

代码

> t.test(x, conf.level=0.99)

One Sample t-test

data: x

t = 59.2578, df = 49, p-value < 2.2e-16

alternative hypothesis: true mean is not equal to 0

99 percent confidence interval:

96.0239 105.1207

sample estimates:

mean of x

100.5723

这样就将置信区间扩大到96.02 < μ < 105.12。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流，内容版权归原作者所有，如涉作品、版权和其他问题请给「我们」留言处理。

R语言 R语言数据分析 R语言教程

赞 (2)

R语言入门秘录11/25：根据名称选择数据框中的列

上一篇 2016-01-05 13:55

R语言入门秘录13/25：比例的置信区间

下一篇 2016-01-07 14:31

意见反馈

返回顶部