摘要:利用回归方程进行预测,如果X的取值范围在样本范围之内,则预测相对是准确的。如果超出这个范围,预测则要小心,因为在样本数据之外变量所形成的关系可能会发生变化,而不再是线性关系。

基础准备

前面以两变量的简单线性相关与回归分析为例,分篇幅介绍了以下内容:

  • 相关与回归分析基础;
  • 一元(简单线性)相关分析与回归分析;
  • 回归参数的区间估计;
  • 一元(简单线性)回归方程的假设检验;

今篇用例题将上面的内容串联起来,讲述简单线性(一元)相关与回归分析的完整过程。

范例分析

某个工厂生产运营多年,生产与销售情况比较稳定。老板想建立产量与单位成本的数量关系模型。现在收集了之前12年的产量与单位成本资料(如下表),根据这些资料说明产量与单位成本的数量关系,并通过产量预测单位成本。

小白学统计(73)范例分析:一元(简单线性)相关与回归分析-数据分析网
立项分析

工厂运营一项很重要的工作就是成本控制。理论上,产品的产量与单位成本之间有内在联系。按照成本性质,产品成本由固定成本(折旧、人员工资等)和变动成本(包材、原辅料和水电气等)构成,其中的固定成本总额在一定范围内,与产量无关。当产量变动时,单位产品所负担的固定费用也会变化,从而使单位成本发生变动。因此,产量变化与单位成本由相关关系,但还需要通过数据验证。

1、散点图。因为要分析的是产量对单位成本的影响,所以,将产量作为自变量,单位成本作为因变量(回顾:一元(简单线性)相关分析与回归分析)。

小白学统计(73)范例分析:一元(简单线性)相关与回归分析-数据分析网
从图形上看,产量与单位成本呈负的线性关系,这与实际是相符的。

2、通过相关系数来验证这种关系(回顾:一元(简单线性)回归方程的假设检验)。

小白学统计(73)范例分析:一元(简单线性)相关与回归分析-数据分析网
相关系数可以通过决定系数计算,也可以通过协方差计算,两者计算结果一致(回顾:一元(简单线性)回归方程的假设检验):

小白学统计(73)范例分析:一元(简单线性)相关与回归分析-数据分析网
从相关系数可见产量与单位成本具有负的高度线性关系,可以建立一元线性回归方程。

3、建立一元线性回归方程(回顾:一元(简单线性)相关分析与回归分析)

小白学统计(73)范例分析:一元(简单线性)相关与回归分析-数据分析网
回归方程表明随着产量的增加单位产品成本降低。产量每增加100件,单位产品成本下降0.2元。当产量为0时,单位成本是16.45元,是固定成本发生的部分。

4、回归方程的检验(一元(简单线性)回归方程的假设检验)

回归方程的检验有三种方法(回顾:一元(简单线性)回归方程的假设检验),这里用回归系数检验方法,给定显著水平0.05,进行检验。

小白学统计(73)范例分析:一元(简单线性)相关与回归分析-数据分析网

5、区间估计(回顾:回归参数的区间估计)

因为上面计算得到的回归方程是一个点估计,可以在95%的置信水平下,根据样本数据估计总体单位成本下降的置信区间。

b的双侧95%置信区间

小白学统计(73)范例分析:一元(简单线性)相关与回归分析-数据分析网
数据说明,在95%的置信水平下,产量每增加100件,单位产品成本下降0.139~0.261元之间。

单位成本的预测

假设某年计算生产2800件产品,预测单位成本的95%置信区间。

将X=28代入回归方程,Y=10.85,置信区间为:

小白学统计(73)范例分析:一元(简单线性)相关与回归分析-数据分析网
计算结果说明,在95%的概率下,当产量为2800件时,产品的单位成本在8.85~12.85元之间。

利用回归方程进行预测,如果X的取值范围在样本范围之内,则预测相对是准确的。如果超出这个范围,预测则要小心,因为在样本数据之外变量所形成的关系可能会发生变化,而不再是线性关系。