数据分析入门基础—统计学(笔记,附学习资料)

文章仅为统计学基础知识的学习笔记,供快速查找。如果只需要电子书及视频学习资料,拉到文尾自行提取(无密码)。

第一章 变量和图形

统计学:科学方法收集、整理、汇总、描述和分析数据资料,并在此基础上进行推断和决策的科学;

归纳统计学/统计推断:通过样本分析来给总体下结论

描述性统计学/演绎统计学:值描述和分析特定对象而不下结论或推断

变量、常量、连续变量、离散变量、连续数据、离散数据

自变量、因变量、函数、单值函数、多值函数

第二章 频数分布

数组阵列:原始数据按照数量大小升序或者降序排列,最大值与最小值的差为全距;

组距、组限、组界、组中值、直方图与频率多边形

频率分布=某一组频数/总频数

累计频数分布/累计频数表,累计频数多边形/卵形线

累计频率分布/百分率累计频数=累计频数/总频数

第三章 均值、中位数、众数及其他表示集中趋势的度量

1、平均值/集中趋势的度量:趋向落在根据数值大小排列的数据的中心

算术平均:

数据分析入门基础---统计学(笔记,附学习资料)

加权算术平均:

数据分析入门基础---统计学(笔记,附学习资料)

2、中位数:一组数根据数量大小排列后的做兼职或者两个中间值的算术平均值

3、众数:一组数出现次数最多的那个数,众数不一定存在,也不唯一

均值、中位数和众数之间的关系:

数据分析入门基础---统计学(笔记,附学习资料)

4、几何平均G

数据分析入门基础---统计学(笔记,附学习资料)

5、调和平均H

数据分析入门基础---统计学(笔记,附学习资料)

算术平均、几何平均和平均之间的关系

数据分析入门基础---统计学(笔记,附学习资料)

6、均方根RMS

数据分析入门基础---统计学(笔记,附学习资料)

第四章 标准差和其他表示利差的度量

离差/变差:数值数据围绕其平均值分布的分数与集中程度,常用的有全距、平均偏差、半内四分位数间距,10-90百分位数间距、标准差;

1、全距:最大值-最小值

2、平均偏差

数据分析入门基础---统计学(笔记,附学习资料)

3、半内四分位数间距

数据分析入门基础---统计学(笔记,附学习资料)

4、10-90百分位数间距

数据分析入门基础---统计学(笔记,附学习资料)

5、标准差

数据分析入门基础---统计学(笔记,附学习资料)

6、方差:标准差的平方

离差度量间的关系

数据分析入门基础---统计学(笔记,附学习资料)

第五章 矩、偏度和峰度

1、矩

数据分析入门基础---统计学(笔记,附学习资料)

2、r阶中心矩

数据分析入门基础---统计学(笔记,附学习资料)

3、偏度:分布不对称程度或偏离对称程度的反映

数据分析入门基础---统计学(笔记,附学习资料)

 

4、峰度:分布的陡峭程度,尖峰、扁峰、常峰态

第六章 初等概率论

1、概率

数据分析入门基础---统计学(笔记,附学习资料)

2、条件概率,独立和不独立事件

数据分析入门基础---统计学(笔记,附学习资料)

 

数据分析入门基础---统计学(笔记,附学习资料)

3、互不相容事件:两个或多个事件中,任意两个事件都不能同时发生

4、概率分布

离散型:离散型概率分布

连续型:概率密度函数、连续型概率分布

5、数学期望

如果一个人活得S美元的概率为p,则他的数学期望=pS

第七章 二项分布、正态分布和泊松分布

1、二项分布

数据分析入门基础---统计学(笔记,附学习资料)

 

数据分析入门基础---统计学(笔记,附学习资料)

2、正态分布

数据分析入门基础---统计学(笔记,附学习资料)

 

数据分析入门基础---统计学(笔记,附学习资料)

正太分布与二项分布的关系

数据分析入门基础---统计学(笔记,附学习资料)

3、泊松分布

数据分析入门基础---统计学(笔记,附学习资料)

4、多项分布

数据分析入门基础---统计学(笔记,附学习资料)

第八章 初等抽样理论

随机样本、随机数、有放回和无放回抽样

1、抽样分布

均值的抽样分布

数据分析入门基础---统计学(笔记,附学习资料)

2、标准误差

一个统计量的抽样分布的标准差常称为该统计量的标准误差

第九章 统计估计理论

1、无偏估计

数据分析入门基础---统计学(笔记,附学习资料)

2、有效估计

数据分析入门基础---统计学(笔记,附学习资料)

3、点估计和区间估计

数据分析入门基础---统计学(笔记,附学习资料)

第十章 统计决策理论

统计假设、零假设/原假设、备择假设

假设建业、显著性检验/决策法则

1、第一类和第二类错误

数据分析入门基础---统计学(笔记,附学习资料)

2、正太分布的检验、双边检验和单边检验、特殊检验、OC曲线

第十一章 小样本理论

样本容量N<30时,称为小样本,对小样本统计量的抽样分布的研究称之为小样本理论,得到的结论不仅适用于小样本问题,也适用于大样本问题,也称为精确抽样理论。

1、t分布

数据分析入门基础---统计学(笔记,附学习资料)

 

数据分析入门基础---统计学(笔记,附学习资料)

数据分析入门基础---统计学(笔记,附学习资料)

第十二章 曲线拟合和最小二乘法

数据分析入门基础---统计学(笔记,附学习资料)

数据分析入门基础---统计学(笔记,附学习资料)

 

 

 

 

 

 

 

 

概率为p,则他的数学期望=pS

 

电子书资源:

大数据的统计学基础  https://pan.baidu.com/s/1AwT9gav5pK0xcjhgc6YchQ

统计学基本概念、统计学(第三版) https://pan.baidu.com/s/1BRhZgcGuDMelSuFWx4eLLA

来源:https://www.jianshu.com/p/222835122ad0

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

(6)
上一篇 2018-08-09 23:37
下一篇 2019-03-16 22:29

相关文章

关注我们
关注我们
分享本页
返回顶部