1. 数据分析网首页
  2. 大数据
  3. 统计学

《深入浅出统计学》8正态分布的运用:保持正态

离散概率分布并非无所不能

除了数值是离散的概率分布以外,还有一大类,即数值是连续的概率分布。正态分布是一种重要的连续型概率分布。

连续型数据

连续型数据往往通过测量得到,而不是通过计数得到,测量结果在很大程度上取决于测量精度的要求。

对于离散概率分布,我们关心的是取得一个特定数值的概率;而对于连续概率分布来说,我们关心的是取得一个特定范围内的概率。

概率密度函数

我们用概率密度函数描述连续随机变量的概率分布。

概率密度函数f(x)是这样的一种函数:通过它可以求出一个数据范围内的某个连续变量的概率,它向我们指出概率分布的形状。

要点1

1

正态分布

正态分布是一种普遍规律,应用非常地广泛。

正态分布是连续数据的“理想”模型。

正态分布具有钟形曲线,曲线对称,中央部位的概率密度最大。越是偏离均值,概率密度越小。均值和中位数均位于中央,具有最大概率密度。

2

如何求正态概率?

第一步:确定分布与范围(正态分布的均值和标准差)

第二步:使其标准化

第三步:查找概率

概率表所给出的概率,如图所示。

3
4

要点2

5

重要的统计量

标准分

6

总结

1 连续型数据的概率分布表示方式——概率密度函数

2 两种典型的概率密度函数,均匀分布和正态分布

作者:王路情,80后,数据科学研究者和实践者,包括数据科学知识传播,数据挖掘项目实践,数据分析报告撰写等工作。
来自:http://www.wangluqing.com/2015/07/09/luqinbiji11/

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

联系我们

如有建议:>>给我留言

QR code