第十一章
多元线性回归与多元逐步回归
(MultipleLinearRegression
andMultipleStepwiseRegression)
华中科技大学同济医学院尹平
编辑ppt
例子
一个应变量与多个自变量间的关系
第十一章
多元线性回归与多元逐步回归
(MultipleLinearRegression
andMultipleStepwiseRegression)
华中科技大学同济医学院尹平
编辑ppt
例子
一个应变量与多个自变量间的关系
儿童身高与年龄、性别的关系
肺活量与年龄、性别、身高、体重
以及胸围的呼吸差等因素的关系
多元线性回归
如构成线性依存关系
编辑ppt
第一节多元线性回归第二节 多元逐步回归第三节多元线性回归的注意事项
编辑ppt
第一节多元线性回归(multiplelinearregression)
编辑ppt
多元线性回归的数据格式
编辑ppt
一、多元线性回归方程(multiplelinearregressionequation)
常数项,表示当所有自变量为0时
应变量Y的总体平均值的估计值
表示除以外的其它自变量固定不变
的情况下,每改变一个测量单位时
所引起的应变量Y的平均改变量
bj为偏回归系数(partialregressioncoefficient)
编辑ppt
两个自变量与应变量的散点图
编辑ppt
两个自变量与应变量的拟合面
bj为xj方向的斜率
编辑ppt
根据最小二乘法(methodofleastsquare)原理求出bj,即
得到bj
编辑ppt
、胰岛素及生长素的测定值列于下表中,试建立血糖对于胰岛素及生长素的二元线性回归方程。
编辑ppt
对于本例有:
采用最小二乘法即可求出常数项b0和偏回归系数b1、b2。其中
编辑ppt
对表11-2的数据资料由SAS统计软件可得到如下表11-3的主要结果。
由此得到回归方程为
编辑ppt
二、回归方程的假设检验
其中:
自由度为总=n-1,回归=k,剩余=n-k-1
编辑ppt
X2
X1
Y
ModelSS
TotalSS
ResidualSS
编辑ppt
由表11-4可知,F=,P<。从而,拒绝H0,可以认为β1和β2不全为0,即所求回归方程有统计学意义。
H0:β1=β2=0 H1:β1和β2不全为0
=
对表11-3的数据资料,由SAS统计软件可得到如下表11-4的模型检验结果。
编辑ppt
(1)F 检验
j=1,2,…,k
之中,U为Xj的偏回归平方和,即U=SS回归-SS回归(-j)
Fj服从F(1,n-k-1)分布
编辑ppt
表11-5
方程内
自变量
平方和
F
P
SS回归
SS回归-SS回归(-j)
SS残差
X1,X2
X2
<
X1
>
在=,可以认为胰岛素对血糖的线性回归关系有统计学意义,而生长素对血糖的线性回归关系无统计学意义。所以应剔除X2,只建立X1与Y的线性回归方程。
编辑ppt
(2) t检验
j=1,2,…,k
,P=;
在α=,认为血糖与胰岛素的线性回归关系
有统计学意义,而与生长素的线性回归关系无统计学意义。
结论与F检验一致。
,P=。
编辑ppt
三、标准化回归系数(standardizedpartialregressioncoefficient)
式中,Sj及Sy分别为自变量Xj及因变量Y的标准差。
可以利用标准化偏回归系数的大小
来反映各自变量的贡献大小。
编辑ppt
(multiplecorrelationcoefficient)又称多元相关系数或全相关系数,表示回归方程中的全部自变量X共同对应变量Y的相关密切程度。复相关系数取值总为正值,在0与1之间,简记为R。如果只有一个自变量,此时
四、复相关系数与决定系数
编辑ppt
(coefficientofdetermination) 复相关系数的平方又称决定系数,记为,用以反映线性回归方程能在多大程度上解释应变量Y的变异性。
回归方程的拟合程度越好,残差平方和就越小,决定系数越接近1,决定
多元线性回归与多元逐步回归 来自淘豆网m.daumloan.com转载请标明出处.