多元线性回归分析
本讲稿第一页,共五十四页
人的体重与身高、胸围
血压值与年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史
糖尿病人的血糖与胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂
射频治疗仪定向治疗脑肿瘤过程中,脑皮质andardized
Variable DF Estimate Error t Value Pr > |t| Estimate
变量 自由度 偏回归系数 标准误 t值 P值 标准化回归系数
Intercept 22 0
X1 22
X2 22
X3 22 - - -
X4 22
②偏回归系数的假设检验— t 检验
本讲稿第二十一页,共五十四页
指定REG过程进行多元线性回归分析,拟合y与四个自变量间的多元线性回归方程
本讲稿第二十二页,共五十四页
整个方程有统计学意义
各自变量的参数估计
对偏回归系数的假设检验
本讲稿第二十三页,共五十四页
注意
本讲稿第二十四页,共五十四页
变量
回归系数bj
标准化偏回归系数b’j
X1
X2
X3
-
-
X4
3、标准化偏回归系数
本讲稿第二十五页,共五十四页
偏回归系数
偏回归系数标准误
标准偏回归系数
本讲稿第二十六页,共五十四页
(三)计算相应指标,对模型的拟合效果进行评价
评价回归方程回归效果的优劣是回归分析的重要内容之一。
常用评价指标有:
复相关系数、
决定系数、
校正决定系数、
剩余标准差等。
本讲稿第二十七页,共五十四页
复相关系数(R),衡量因变量Y与回归方程内所有自变量线性组合件相关关系的密切程度。
0<=R<=1,没有负值。
R的值越接近1,说明相关关系越密切;越接近0说明相关关系越弱。
本讲稿第二十八页,共五十四页
本讲稿第二十九页,共五十四页
本讲稿第三十页,共五十四页
3、剩余标准差
本讲稿第三十一页,共五十四页
4、校正决定系数
本讲稿第三十二页,共五十四页
三、逐步回归分析
本讲稿第三十三页,共五十四页
(一)最优子集回归法
求出所有自变量可能组合子集的回归方程的模型(共有2m-1个),按一定准则选择最优模型,常用的准则有:
①校正决定系数(考虑了自变量的个数)
②Cp准则(C即criterion,p为所选模型中变量的个数;Cp接近p+1的模型为最优)
③AIC(Akaike`s Information Criterion)准则;AIC 越小越好
本讲稿第三十四页,共五十四页
最优子集法的局限性
如果自变量个数为4,则所有的回归有24-1=15个;当自变量数个数为10时,所有可能的回归为 210-1= 1023个;……..;当自变量数个数为50时,所有可能的回归为250-1≈1015个。
本讲稿第三十五页,共五十四页
(二)逐步选择法
1. 前进法(forward selection)
2. 后退法(backward elimination)
3. 逐步回归法(stepwise regression)。
它们的共同特点是每一步只引入或剔除一个自变量。决定其取舍则基于对偏回归平方和的F检验
本讲稿第三十六页,共五十四页
(1)前进法
自变量从无到有、从少到多
Y对每一个自变量作直线回归,对回归平方和最大的自变量作F 检
多元线性回归分析 来自淘豆网m.daumloan.com转载请标明出处.