多元线性回归分析xin
(一)对多变量资料进行多元分析的优点:
1、减少假阳性错误;
2、可以得到一个综合结论;
3、考虑了变量间的相互关系。
总而言之,是对多个相关变量同时进行分析。
(二)多元线性回归分析的应用条件
(linear)
(indedpendent)
(此条件可以放宽) (normality)
(homogeneity or equal variance)
简称为LINE
多元线性回归
多元线性回归是用线性方程表达一个因变量与多个自变量之间数量关系的统计分析方法。如:儿童的心象面积,除与年龄有关外,还与性别、身高、体重、胸围等因素有关。
复习直线回归(一)
直线回归是研究一个因变量与一个自变量之间线性趋势数量关系的回归分析方法。
1、直线回归方程为ŷ=a+b*x,反映的是x和y之间数量依存变化关系;
2、a是截距,b是回归系数,a和b是利用最小二乘法原理计算而来;
3、用决定系数R2来说明回归模型的好坏,R2 =SS回/SS总。
复习直线回归(二)
(kg) 和肺活量y(L)资料,试建立体重与肺活量的直线回归方程。
SPSS程序:Analyze Regression Linear,打开对话框,把肺活量y放入应变量栏中,体重x放入自变量栏中。
建立的直线回归方程为:ŷ= -+
a= - ;b= ,表示体重每增加1kg ,。
R2 = 。
经t检验,体重对肺活量有影响,P = < 。
多元线性回归模型(一)
举例(见 ):
根据某地29名13岁男童的身高x1(kg)、体重x2(cm)和肺活量y(L)建立的二元线性回归方程为:
ŷ= -+ +
a= - ;
b1= ,表示在体重不变的情况下,身高每增加1cm ,;
b2= ,表示在身高不变的情况下,体重每增加1kg ,。
多元线性回归模型(二)
设因变量为y,自变量为xi(i= 1,….,m),m元线性回归方程为: ŷ=a+b1*x1+b2*x2+….+bm*xm,或 y = ŷ + e 。
ŷ 是y的估计值或预测值;
e是残差,不能由现有的自变量决定的部分;
a为常数项或截距;
bi为样本偏回归系数,即在其它自变量固定不变情况下,xi改变一个单位,因变量平均改变bi 个单位。对应的总体偏回归系数为βi,若βi =0,则该自变量xi与因变量y之间无线性关系,即xi对因变量y无影响 。
回归分析的步骤
1、建立线性回归方程;
2、回归方程的假设检验;
3、偏回归系数的假设检验与区间估计;
4、比较自变量对因变量的作用大小;
5、因变量的区间估计;
6、残差分析。
Analyze→Regression → Linear
建立线性回归方程(一)
即计算截距a和回归系数bi ,应用最小二乘法原理,即要求残差平方和达到最小。
以 ,作身高、体重对肺活量影响的多元线性回归分析。
选择变量的方法有强迫引入法(系统默认)、强迫剔除法、向前引入法、向后剔除法、逐步回归法。
多元线性回归分析xin 来自淘豆网m.daumloan.com转载请标明出处.