小白学统计(75)范例分析:多元线性回归分析

基础回顾

简单线性和多元线性回归理论基础请回顾:

  • 相关与回归分析基础;
  • 一元(简单线性)相关分析与回归分析;
  • 回归参数的区间估计;
  • 一元(简单线性)回归方程的假设检验;
  • 范例分析:一元(简单线性)相关与回归分析;
  • 多元线性回归分析;

线性回归的步骤不论是一元还是多元相同,步骤如下:

  • 1、散点图判断变量关系(简单线性);
  • 2、求相关系数及线性验证;
  • 3、求回归系数,建立回归方程;
  • 4、回归方程检验;
  • 5、参数的区间估计;
  • 6、预测;

范例分析

王某等人承包了某快递公司在某地的快递业务,一段时间后发现:有时候承接工作量大,完不成快递任务;有时候工作量不足,员工等待。为了制定最佳的工作计划表,王某希望估计快递员每天的工作时间(工资计件,没有偷懒现象),以便决定每天承接的快递数量。王某分析,快递员每天工作的时间与送货距离和送货次数相关。为此,他收集了由10项送货任务组成的简单随机样本数据,并根据这些数据建立二元线性回归方程。数据如下表:

项目分析

研究的目的是预测快递员运送任务所需要的时间,所以设时间为因变量;距离与次数为自变量。本题直接使用Excel计算结果。

解:1、相关次数;由于是二元回归分析,所以不做散点图,直接用回归系数判别因变量(时间)与自变量总体(距离与次数)之间的相关关系。Excel计算结果:


复相关系数R为0.9383,说明因变量时间与作为一个整体的所有自变量(距离和次数)高度线性相关。

2、回归系数及回归方程


通过Excel计算结果,可以得到回归系数及回归方程:


意义:回归系数0.042表示在固定次数的条件下,送货距离每增加1公里,行驶的时间平均增加0.042小时;同理,回归系数0.573表示在送货距离固定的条件下,送货次数每增加1次,送货的时间平均增加0.573小时。本例中,截距-0.01没有实际意义,只起调节数值的作用。

3、回归方程的检验

回归方程的检验有三种方法(回归方程显著性检验,回归系数显著性检验和相关系数显著性检验),效果相同,选择其一检验即可。Excel给出的是回归方程的显著性检验结果:


Significance F=0.000591表示统计量F=25.77422的概率值,通过与显著水平(设定为0.05)的比较,表示F值落在拒绝域,所以结论与上相同,即线性回归方程式显著的。

4、区间估计


从上表可知,在95%置信度条件下,回归系数b1的置信区间为(0.025,0.059),b2的置信区间为(0.069,1.077)。

5、预测

某个快递员某天的任务是快递3件货,最优送货路线总长为120公里,预测送货时间,并得到95%的时间区间。

通过回归方程可得预测的送货时间为6.749小时:


95%置信度下,送货时间的置信区间为:


Excei计算结果中有Se的值,但是没有包含t统计量:


t统计量值用公式:=T.INV.2T(0.05,7)得到2.365,所以该题中送货时间区间为:

(6.749-2.365*0.639,6.749+2.365*0.639)

(5.24,8.26)

所以该条件下送货时间区间为5.24小时~8.26小时。

生活统计学

生活统计学

1、让统计知识通俗、生活化。 2、分析软件使用简化工作。 3、书籍资源快乐分享。微信公众号:SPSS生活统计学,更多精彩内容请关注“SPSS生活统计学”微信公众平台。
生活统计学

注:数据分析网遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏,请联系主编邮箱:afenxi@afenxi.com

分享到:更多

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址