多元线性回归分析正式
本讲稿第一页,共六十页
*
第一节 多元线性回归
一、多元线性回归模型
本讲稿第二页,共六十页
*
本讲稿第三页,共六十页
*
多元回归:多个Y,多个X
多重回归:一个Y,多个X
第三十七页,共六十页
*
对Xj的取舍要进行F检验:
计算进行到第l步时:
p :方程中自变量个数
SS回:Xj的偏回归平方和
SS残:残差平方和
本讲稿第三十八页,共六十页
*
(只选不剔)
开始方程中无自变量,然后从方程外选取偏
回归平方和最大的自变量作F检验以决定是否选入方程,直至无自变量可以引入方程为止。
缺点:后续变量的引入可能使先前引入的变
量变的不重要。
Xj入选
本讲稿第三十九页,共六十页
*
(只剔不选)
开始方程中包含全部自变量,然后从方程中选取偏回归平方和最小的自变量作F检验以决定是否从方程中剔除,直至无自变量可以从方程中剔除为止。
缺点:当某些自变量高度相关时,可能得不
出正确结果。
Xj剔除
本讲稿第四十页,共六十页
*
(先选后剔,双向筛选)
开始方程中无自变量,从方程外选取偏回归平方和最大的自变量作F检验以决定是否选入方程;
每引一个自变量进入方程后,从方程中选取偏回归平方和最小的自变量作F检验以决定是否从方程中剔除;
直至方程外无自变量可引入,方程内无自变量可剔除为止。
本讲稿第四十一页,共六十页
*
Xj剔除
内剔
Xj入选
外引
α入值定的越小选取自变量标准越严,被选
入方程内自变量数越少。 α入值越大则反之。
小样本:α入=,α出=。
大样本:α入=,α出=。
α入<α出,以免Xj上一步剔除后下一步又被选入
本讲稿第四十二页,共六十页
*
选X4前先建立4个直线回归方程;
选X1前先建立1个含3个自变量、 3个含2个
自变量的多元线性回归方程。
本讲稿第四十三页,共六十页
*
本讲稿第四十四页,共六十页
*
本讲稿第四十五页,共六十页
*
本讲稿第四十六页,共六十页
*
本讲稿第四十七页,共六十页
*
本讲稿第四十八页,共六十页
*
第三节
多元线性回归的应用及注意事项
本讲稿第四十九页,共六十页
*
一、多元线性回归的应用
年龄(X1)
饮食习惯(X2)
吸烟状况(X3)
工作紧张度(X4)
家族史(X5)
高血压(Y)
bj的意义为在其它自变量保持不变时,Xj增加或减少一个单位时Y的平均变化量。故可排除混杂因素。
本讲稿第五十页,共六十页
*
心脏表面积(Y)=b0+b1心脏横径(X1)
+ b2心脏纵径(X2)+ b3心脏宽径(X3)
新生儿体重(Y)=b0+b1胎儿孕龄(X1)+ b2 胎儿
头径(X2)+ b3胎儿胸径(X3)+ b4胎儿腹径(X4)
本讲稿第五十一页,共六十页
*
利用回归方程进行逆估计,确定Y后控制X 。
采用射频治疗仪治疗脑肿瘤:
脑皮质毁损半径(Y)
=b0+b1射频温度(X1)+ b2照射时间(X2)
本讲稿第五十二页,共六十页
*
二、多元线性回归应用的注意事项
应变量Y为连续变量
自变量X可为连续、有序分类或无序分类变量
(1)连续变量:X
(2)有序分类变量:
1 轻
X= 2 中
3 重
本讲稿第五十三页,共六十页
*
(3)无序分类变量
哑变量(dummy variables)
本讲稿第五十四页,共六十页
*
n至少是X个数m的5~10倍
实际应用中非常普遍,可使最小二乘法建
立的回归方程失效;
消除方法:主成分回归;剔除某个造成共
线性的自变量。
本讲稿第五十五页,共六十页
*
某一自变量对Y的作用大小与另一自变量的取值有关。
血糖(Y)与总胆固醇 (X1)、甘油三酯(X2)、胰岛素(X3)、糖化血红蛋白(X4)间逐步回归方程:
X3与X4间有交互作用:
本讲稿第五十六页,共六十页
*
标准化残差
本讲稿第五十七页,共六十页
*
e’
0
本讲稿第五十八页,共六十页
*
多元线性回归分析正式 来自淘豆网m.daumloan.com转载请标明出处.