统计学教程

  • 小白学统计(13)离散型随机变量概率分布——二项分布

    所谓概率分布,是指随机变量的取值与该取值发生概率所构成的分布。概率分布描述了一个随机变量的所有取值与其相应概率值之间的关系。它可以分为离散型概率分布和连续型概率分布(离散型及连续型随机变量分类见上一篇)。 离散型概率分布主要有以下三种: 二项分布 泊松分布 超集合概率分布 今天介绍的是离散型随机变量的二项分布。 在许多试验中,结果往往只有两个。例如:检查产品…

    2016-08-13
  • 小白学统计(12)——通俗归纳离散型概率分布

    基础准备 随机变量回顾请见第8篇《随机变量的种类与描述》 概率回顾请见第5篇《推断理论基础——概率》 两个概念 随机变量分类:离散型随机变量和连续性随机变量。可以用“点”和“线”来类比理解。“点”(离散型)就是随机变量的取值是有限个或可列无限个。“线”(连续型)就是随机变量的取值在某一段区间上可以取无线多个。 概率分布:是指随机变量的取值与其概率所构成的分布…

    2016-08-12
  • 小白学统计(11)——随机变量的种类与描述

    研究随机现象中存在的统计规律性,可以将随机现象的结果与实际数值对应起来,即将结果数量化。因为随机现象如果可以用数值来描述,那么就可以将数学分析的方法引入到随机现象的研究中。 有些实验结果是用数值表现的,我们可以直接用这些数值代表随机变量的数值,如掷骰子的点数。但有一些试验的结果并不是数值,而是各种态度,观点和属性,如记录顾客的性别,对于这样的试验结果,我们通…

    2016-08-11
  • 小白学统计(10)——贝叶斯定理(统计在生活中的应用)

    贝叶斯(Thomas Bayes, 1701—1761)是英国人,主要职业是牧师,业余爱好才是数学。他为了证明上帝的存在,发明了概率统计学原理,虽然他的这一美好愿望至死也未能实现,却为统计学的发展做出了巨大的贡献。

    2016-08-10
  • 小白学统计(9)——贝叶斯定理(概率的修正方法)

    贝叶斯定理是用来描述两个条件概率之间关系的定理,比如P(A|B)和P(B|A),通常,事件A在事件B发生的条件下的概率{P(A|B)}与事件B在事件A的条件下的概率{P(B|A)}是不一样的,但是这两者之间有确定的关系,贝叶斯法则就是这种关系的陈述,按照乘法法则:P(A∩B)=P(A)*P(B|A)=P(B)*P(A|B),可以立刻导出P(B|A)=P(A|…

    2016-08-09
  • 小白学统计(8)——概率的基本运算法则

    学习概率运算法则之前,需要知道事件之间的关系。事件之间的关系有以下三种: 1)事件的补。事件A的补就是所有在样本空间S内但不包括在A内的所有样本点的集合。A的补用表示。 2)两事件的并。属于事件A或属于事件B或同事属于事件A和B的样本点组成的集合。记作。 3)两事件的交。同事属于事件A和事件B的样本点的集合。记作 4)互斥事件。如果事件A发生,则事件B就不发…

    2016-08-08
  • 小白学统计(7)——推断理论基础(概率)

    在我们的日常生活和工作中,经常会遇到许多包含不确定结果的现象。例如,股票的价格是要上涨、下跌或者平盘?已经布满乌云的天空是否下雨?某项工程是否能够按期完工?投资项目盈利可能性多大?等等。 上述这些现象都有两个特点: 1) 事先不能确定哪一个结果出现; 2) 各种结果在多次重复过程中体现出某种统计学规律; 这类现象就称为不确定现象,或者称为随机现象。因此,我们…

    2016-08-07
  • 小白学统计(6)——统计资料的图形描述(几何图)

    所谓几何图就是利用几何图形的线形、长度、面积或体积等长短或大小变化来表示统计资料的图形。主要有散点图、条形图、直方图、饼形图、线形图和累计图等。 散点图(Scatter Chart),也称XY图,用于比较成对的数值,是用不同位置的点来描述数据的一种图形。它经常被用来研究两种变量之间的相关关系,是探索数据之间的关系形态及关联程度常用的一种图形,它通常用于比较跨…

    2016-08-06
  • 小白学统计(5)——数据离散程度描述

    集中趋势指标是数据的一个特征,数据的另一个特征是离散程度指标。在统计分析中,离散程度指标可以说明集中趋势指标的代表性如何,还可在统计推断时用来计算误差的大小。另外,离散程度指标还被用来说明事物在发展变化过程中的均衡性、节奏性和稳定性等问题。例如,有两组数据,第一组是19,20,21,第二组是15,20,25。如果只根据均值(两组的均值都是20)我们将无法区别…

    2016-08-05
  • 检测异常值的参数和非参数方法

    摘要:如何利用参数和非参数方法来检测异常值 异常值是指距离其他观测值非常遥远的点,但是我们应该如何度量这个距离的长度呢同时异常值也可以被视为出现概率非常小的观测值,但是这也面临同样的问题——我们要如何度量这个概率的大小呢 有许多用来识别异常值的参数和非参数方法,参数方法需要一些关于变量分布情况的假设条件,而非参数方法并不需要这些假设条件。此外,你还可以利用单…

    2016-04-04
  • 说人话的统计学:见识数据分析的「独孤九剑」

    为什么不发明一些统计检验直接算出假设成立的可能性呢?

    2015-09-12
  • 《深入浅出统计学》15相关与回归:我的线条如何?

    了解事物之间的相互关系可以丰富你的信息,让你了解真相,使你立于不败之地。 发现事物之间的相互关系:相关与回归。 数据类型探讨 单变量数据考虑的是一个单一变量的频数或者概率。 二变量数据给出两个变量的数值,如果其中一个变量以某种方式受到控制,或者被用来解释另一个变量,则这个变量被称为自变量或者解释变量,另一个变量则称为因变量或者反应变量。 二变量数据可视化 散…

    2015-07-18
  • 《深入浅出统计学》14卡方分布:继续探讨

    有时候事实与期望并不相符,我们需要有这个心理准备,同时,我们需要寻求其他方法进行分析和解答。 使用卡方检验评估差异 检验统计量代表什么 拟合优度检验 拟合优度检验——它检验观察频数是否和假设的概率分布相吻合。 自由度确定规律 要点一 总结 1卡方检验的含义 2卡方检验的应用 练习

    2015-07-17
  • 《深入浅出统计学》13 假设检验的运用:研究证据

    他人的言论未必句句真实可信。如何判断和定论?其目的就是发现真相,还原本真,呈现可靠。 如何判断他人的言论是真,是假?假设检验是一种思维方法——利用样本检验各种统计断言是否可能属实。通过假设检验可以权衡证据,检验极限结果——是纯属巧合,还是存在其他内在根据。 假设检验具体过程 查看断言 查看证据 做出决策 假设检验的六个步骤 原假设 备选假设 注意:进行假设检…

    2015-07-16
  • 《深入浅出统计学》12 置信区间的构建:自信地猜测

    有时候样本无法给出足够正确的结果。 点估计量是我们有可能给出的总体统计量的最佳估计。点估计量是有价值的,但也许存在小小的误差。为什么呢?原因很简单,因为我们用的是样本。 认识置信区间 利用点估计量,是通过指定一个确切的数值估计总体。 我们不指定一个确切的数值,而是指定两个数值,即为总体的均值确定一个区间。 求解置信区间的四步骤 关于上述步骤,解说如下。 第一…

    2015-07-15

联系我们

如有建议:>>给我留言

QR code