第5章线性回归分析与方差分析
§ 一元线性回归分析
§ 可线性化的非线性回归
§ 多元线性回归简介
§ 方差分析
§ 一元线性回归分析
在许多实际问题中,我们常常需要研究多个变量之间的相互关系。
一般来说,变量之间的关系可分为两类:
一类是确定性关系,确定性关系是指变量之间的关系可以用函数关系来表达,例如电流I电压V电阻R之间有关系式V=IR。
另一类是非确定性关系,有些变量之间的关系是非确定性的关系,这种关系无法用一个精确的函数式来表示。
例如,农作物的单位面积产量与施肥量之间有密切的关系,但是不能由施肥量精确知道单位面积产量,这是因为单位面积产量还受到许多其他因素及一些无法控制的随机因素的影响。
又如,人的身高与体重之间存在一种关系,一般来说,人身高越高,体重越大,
但同样高度的人,体重却往往不同。这种变量之间的不确定性关系称之为相关关系。
对于具有相关关系的变量,虽然不能找到他们之间的确定表达式,但是通过大量的观测数据,可以发现他们之间存在一定的统计规律,
数理统计中研究变量之间相关关系的一种有效方法就是回归分析。
一、一元线性回归模型
其中yi是x=(xi,yi)(i=1,…,n)在直角坐标系中进行描点,.
假定我们要考虑自变量x与因变量Y之间的相关关系
假设x为可以控制或可以精确观察的变量,即x为普通的变量。由于自变量x给定后,因变量Y并不能确定,从而Y是一个与x有关的随机变量
我们对于可控制变量x取定一组不完全相同的值x1,…,xn,作n次独立试验,得到n对观测结果:
(x1,y1) ,(x2,y2),…,(xn, yn)
例1 对某广告公司为了研究某一类产品的广告费x用与其销售额Y之间的关系,对多个厂家进行调查,获得如下数据
厂家
1
2
3
4
5
6
7
8
9
广告费
6
10
21
40
62
62
90
100
120
销售额
31
58
124
220
299
190
320
406
380
广告费与销售额之间不可能存在一个明确的函数关系,事实上,即使不同的厂家投入了相同的广告费,其销售额也不会是完全相同的。影响销售额的因素是多种多样的,除了广告投入的影响,还与厂家产品的特色、定价、销售渠道、售后服务以及其他一些偶然因素有关。
画出散点图如图5-,随着广告投入费x的增加,销售额Y基本上也呈上升趋势,,这是由于Y还受到其他一些随机因素的影响.
这样,Y可以看成是由两部分叠加而成,一部分是x的线性函数a+bx,另一部分是随机因素引起的误差,即
Y=a+bx+
o
x
y
100
200
300
400
500
20
40
60
80
100
120
L
*
*
*
*
*
*
*
*
*
这就是所谓的
一元线性回归模型
图5-1
一般地,假设x与Y之间的相关关系可表示为
(1)
其中:a, b为未知常数
为随机误差且
未知,
x与Y的这种关系称为一元线性回归模型
y=a+bx称为回归直线 b称为回归系数
此时
对于(x, Y)的样本(x1,y1),…,(xn,yn)有:
一元线性回归主要解决下列一些问题:
(1)利用样本对未知参数a、b、进行估计;
(2)对回归模型作显著性检验;
(3)当x=x0时对Y的取值作预测,即对Y作区间估计.
如果由样本得到式(1)中,a, b的估计值,则称为拟合直线或经验回归直线,它可作为回归直线的估计
二、参数a、b、的估计
最小二乘法就是选择a,b的估计,使得
Q(a, b)为最小(图5-2)
现在我们用最小二乘法来估计模型(1)中的未知参数a,b.
记
称Q(a, b)为偏差平方和
图5-2
补充:线性回归与方差分析 来自淘豆网m.daumloan.com转载请标明出处.