多元线性回归分析
现在学习的是第1页,共55页
人的体重与身高、胸围
血压值与年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史
糖尿病人的血糖与胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂
射频治疗仪定向治疗脑肿瘤过程中,脑d Standardized
Variable DF Estimate Error t Value Pr > |t| Estimate
变量 自由度 偏回归系数 标准误 t值 P值 标准化回归系数
Intercept 22 0
X1 22
X2 22
X3 22 - - -
X4 22
②偏回归系数的假设检验— t 检验
现在学习的是第21页,共55页
指定REG过程进行多元线性回归分析,拟合y与四个自变量间的多元线性回归方程
现在学习的是第22页,共55页
整个方程有统计学意义
各自变量的参数估计
对偏回归系数的假设检验
现在学习的是第23页,共55页
注意
现在学习的是第24页,共55页
变量
回归系数bj
标准化偏回归系数b’j
X1
X2
X3
-
-
X4
3、标准化偏回归系数
现在学习的是第25页,共55页
偏回归系数
偏回归系数标准误
标准偏回归系数
现在学习的是第26页,共55页
(三)计算相应指标,对模型的拟合效果进行评价
评价回归方程回归效果的优劣是回归分析的重要内容之一。
常用评价指标有:
复相关系数、
决定系数、
校正决定系数、
剩余标准差等。
现在学习的是第27页,共55页
复相关系数(R),衡量因变量Y与回归方程内所有自变量线性组合件相关关系的密切程度。
0<=R<=1,没有负值。
R的值越接近1,说明相关关系越密切;越接近0说明相关关系越弱。
现在学习的是第28页,共55页
现在学习的是第29页,共55页
现在学习的是第30页,共55页
3、剩余标准差
现在学习的是第31页,共55页
4、校正决定系数
现在学习的是第32页,共55页
三、逐步回归分析
现在学习的是第33页,共55页
(一)最优子集回归法
求出所有自变量可能组合子集的回归方程的模型(共有2m-1个),按一定准则选择最优模型,常用的准则有:
①校正决定系数(考虑了自变量的个数)
②Cp准则(C即criterion,p为所选模型中变量的个数;Cp接近p+1的模型为最优)
③AIC(Akaike`s Information Criterion)准则;AIC 越小越好
现在学习的是第34页,共55页
最优子集法的局限性
如果自变量个数为4,则所有的回归有24-1=15个;当自变量数个数为10时,所有可能的回归为 210-1= 1023个;……..;当自变量数个数为50时,所有可能的回归为250-1≈1015个。
现在学习的是第35页,共55页
(二)逐步选择法
1. 前进法(forward selection)
2. 后退法(backward elimination)
3. 逐步回归法(stepwise regression)。
它们的共同特点是每一步只引入或剔除一个自变量。决定其取舍则基于对偏回归平方和的F检验
现在学习的是第36页,共55
多元线性回归分析 (2) 来自淘豆网m.daumloan.com转载请标明出处.