关于多元线性回归分析正式
第1页,讲稿共62张,创作于星期日
*
讲课内容
第一节 多元线性回归(重点)
第二节 自变量选择方法(重点)
第三节 多元线性回归的应用及注
意事项
第2页,讲稿 最大者。
选择法
第35页,讲稿共62张,创作于星期日
*
P为方程中自变量个数。
最优方程的Cp期望值是p+1。
应选择Cp最接近P+1的回归方程为最优。
2. 选择法
第36页,讲稿共62张,创作于星期日
*
第37页,讲稿共62张,创作于星期日
*
二、逐步选择法
全局选择计算量很大:
6个变量,计算26-1=63个方程;
10个变量,计算210-1=1023个方程。
按选入变量顺序不同分前进法、后退法
与逐步回归法,共同特点是每一步只引
入或剔除一个自变量Xj。
第38页,讲稿共62张,创作于星期日
*
对Xj的取舍要进行F检验:
计算进行到第l步时:
p :方程中自变量个数
SS回:Xj的偏回归平方和
SS残:残差平方和
第39页,讲稿共62张,创作于星期日
*
(只选不剔)
开始方程中无自变量,然后从方程外选取偏
回归平方和最大的自变量作F检验以决定是否选入方程,直至无自变量可以引入方程为止。
缺点:后续变量的引入可能使先前引入的变
量变的不重要。
Xj入选
第40页,讲稿共62张,创作于星期日
*
(只剔不选)
开始方程中包含全部自变量,然后从方程中选取偏回归平方和最小的自变量作F检验以决定是否从方程中剔除,直至无自变量可以从方程中剔除为止。
缺点:当某些自变量高度相关时,可能得不
出正确结果。
Xj剔除
第41页,讲稿共62张,创作于星期日
*
(先选后剔,双向筛选)
开始方程中无自变量,从方程外选取偏回归平方和最大的自变量作F检验以决定是否选入方程;
每引一个自变量进入方程后,从方程中选取偏回归平方和最小的自变量作F检验以决定是否从方程中剔除;
直至方程外无自变量可引入,方程内无自变量可剔除为止。
第42页,讲稿共62张,创作于星期日
*
Xj剔除
内剔
Xj入选
外引
α入值定的越小选取自变量标准越严,被选
入方程内自变量数越少。 α入值越大则反之。
小样本:α入=,α出=。
大样本:α入=,α出=。
α入<α出,以免Xj上一步剔除后下一步又被选入
第43页,讲稿共62张,创作于星期日
*
选X4前先建立4个直线回归方程;
选X1前先建立1个含3个自变量、 3个含2个
自变量的多元线性回归方程。
第44页,讲稿共62张,创作于星期日
*
第45页,讲稿共62张,创作于星期日
*
第46页,讲稿共62张,创作于星期日
*
第47页,讲稿共62张,创作于星期日
*
第48页,讲稿共62张,创作于星期日
*
第49页,讲稿共62张,创作于星期日
*
第三节
多元线性回归的应用及注意事项
第50页,讲稿共62张,创作于星期日
*
一、多元线性回归的应用
年龄(X1)
饮食习惯(X2)
吸烟状况(X3)
工作紧张度(X4)
家族史(X5)
高血压(Y)
bj的意义为在其它自变量保持不变时,Xj增加或减少一个单位时Y的平均变化量。故可排除混杂因素。
第51页,讲稿共62张,创作于星期日
*
心脏表面积(Y)=b0+b1心脏横径(X1)
+ b2心脏纵径(X2)+ b3心脏宽径(X3)
新生儿体重(Y)=b0+b1胎儿孕龄(X1)+ b2 胎儿
头径(X2)+ b3胎儿胸径(X3)+ b4胎儿腹径(X4)
第52页,讲稿共62张,创作于星期日
*
利用回归方程进行逆估计,确定Y后控制X 。
采用射频治疗仪治疗脑肿瘤:
脑皮质毁损半径(Y)
=b0+b1射频温度(X1)+ b2照射时间(X2)
第53页,讲稿共62张,创作于星期日
*
二、多元线性回归应用的注意事项
应变量Y为连续变量
自变量X可为连续、有序分类或无序分类变量
(1)连续变量:X
(2)有序分类变量:
1 轻
X= 2 中
3 重
第54页,讲稿共62张
多元线性回归分析正式 来自淘豆网m.daumloan.com转载请标明出处.