第 10 章回归分析介绍: 1 、回归分析的概念和模型 2 、回归分析的过程回归分析的概念?寻求有关联(相关)的变量之间的关系?主要内容: n从一组样本数据出发,确定这些变量间的定量关系式 n对这些关系式的可信度进行各种统计检验 n从影响某一变量的诸多变量中,判断哪些变量的影响显著,哪些不显著 n利用求得的关系式进行预测和控制回归分析的模型?按是否线性分:线性回归模型和非线性回归模型?按自变量个数分:简单的一元回归,多元回归?基本的步骤:利用 SPSS 得到模型关系式,是否是我们所要的,要看回归方程的显著性检验( F 检验)和回归系数 b的显著性检验(T检验),还要看拟合程度 R 2 (相关系数的平方,一元回归用 R Square ,多元回归用 Adjusted R Square )回归分析的过程?在回归过程中包括: ? Liner :线性回归? Curve Estimation :曲线估计? Binary Logistic :二分变量逻辑回归? Multinomial Logistic :多分变量逻辑回归? Ordinal 序回归? Probit :概率单位回归? Nonlinear :非线性回归? Weight Estimation :加权估计? 2-Stage Least squares :二段最小平方法? Optimal Scaling 最优编码回归?我们只讲前面 3个简单的(一般教科书的讲法) 线性回归(Liner) ?一元线性回归方程: y=a+bx ? a称为截距? b为回归直线的斜率?用R 2判定系数判定一个线性回归直线的拟合程度:用来说明用自变量解释因变量变异的程度(所占比例) ?多元线性回归方程: y=b 0 +b 1x 1 +b 2x 2+…+b nx n ? b 0为常数项? b 1、b 2、…、b n称为 y对应于 x 1、x 2、…、x n的偏回归系数?用 Adjusted R 2调整判定系数判定一个多元线性回归方程的拟合程度: 用来说明用自变量解释因变量变异的程度(所占比例) ?一元线性回归模型的确定:一般先做散点图(Graphs ->Scatter- >Simple), 以便进行简单地观测(如: Salary 与 Salbegin 的关系) ?若散点图的趋势大概呈线性关系,可以建立线性方程,若不呈线性分布,可建立其它方程模型,并比较 R 2 (-->1) 来确定一种最佳方程式(曲线估计) ?多元线性回归一般采用逐步回归方法- Stepwise 逐步回归方法的基本思想?对全部的自变量 x 1 ,x 2 ,...,x p,按它们对 Y贡献的大小进行比较,并通过 F检验法,选择偏回归平方和显著的变量进入回归方程,每一步只引入一个变量,同时建立一个偏回归方程。当一个变量被引入后,对原已引入回归方程的变量,逐个检验他们的偏回归平方和。如果由于引入新的变量而使得已进入方程的变量变为不显著时,则及时从偏回归方程中剔除。在引入了两个自变量以后, 便开始考虑是否有需要剔除的变量。只有当回归方程中的所有自变量对 Y都有显著影响而不需要剔除时,在考虑从未选入方程的自变量中,挑选对 Y有显著影响的新的变量进入方程。不论引入还是剔除一个变量都称为一步。不断重复这一过程,直至无法剔除已引入的变量, 也无法再引入新的自变量时,逐步回归过程结束。 线性回归分析实例 p240 ?实例: P240Data07-03 建立一个以初始工资 Salbegin 、工作经验 prevexp 、工作时间 jobtime 、工作种类 jobcat 、受教育年限 edcu 等为自变量,当前工资 Salary 为因变量的回归模型。 1. 先做数据散点图,观测因变量 Salary 与自变量 Salbegin 之间关系是否有线性特点? Graphs ->Scatter->Simple ? X Axis : Salbegin ? Y Axis : Salary 2. 若散点图的趋势大概呈线性关系,可以建立线性回归模型? Analyze->Regression->Linear ? Dependent: Salary ? Independents: Salbegin,prevexp,jobtime,jobcat,edcu 等变量? Method: Stepwise ?比较有用的结果: ?拟合程度 Adjusted R 2:越接近 1拟合程度越好?回归方程的显著性检验 Sig ?回归系数表 Coefficients 的 Model 最后一个中的回归系数 B和显著性检验 Sig ?得模型: Salary=-++-
SPSS回归分析 来自淘豆网m.daumloan.com转载请标明出处.