回归分析下
现在学习的是第1页,共30页
本章内容
多元线性回归的回归诊断
曲线估计
线性回归的衍生模型
现在学习的是第2页,共30页
多元线性回归的回归诊断
检验模型假定是否成立
与一线(Exponential),方程为
,变量变换后的线性方程为
现在学习的是第11页,共30页
8、逆函数(Inverse),方程为
变量变换后的方程为
9、幂函数(Power),方程为
变量变换后的方程为
10、逻辑函数(Logistic),方程为
变量变换后的线性方程为
现在学习的是第12页,共30页
SPSS曲线估计中,首先,在不能明确究竟哪种模型更接近样本数据时,可在多种可选择的模型中选择几种模型;然后SPSS自动完成模型的参数估计,并输出回归方程显著性检验的F值和概率p值、判定系数R2等统计量;最后,以判定系数为主要依据选择其中的最优模型,并进行预测分析等。另外,SPSS曲线估计还可以以时间为解释变量实现时间序列的简单回归分析和趋势外推分析。
现在学习的是第13页,共30页
曲线估计的基本操作
可通过绘制并观察样本数据的散点图粗略确定被解释变量和解释变量之间的相关关系,为曲线拟合中的模型选择提供依据。SPSS曲线估计的基本操作步骤是:
(1)选择菜单Analyze-Regression-Curve Estimation,出现窗口如下页所示。
(2)把被解释变量选到Dependent框中。
现在学习的是第14页,共30页
现在学习的是第15页,共30页
(3)曲线估计中的解释变量可以是相关因素变量也可是时间变量。如果解释变量为相关因素变量,则选择Variable选项,并把一个解释变量指定到Independent框;如果选择Time参数则表示解释变量为时间变量。
(4)在Models中选择几种模型。
(5)选择Plot Models选项绘制回归线;选择Display ANOVA table输出各个模型的方差分析表和各回归系数显著性检验结果。
至此,完成了曲线估计的操作,SPSS将根据选择的模型自动进行曲线估计,并将结果显示到输出窗口中。
现在学习的是第16页,共30页
应用举例
1、教育支出的相关因素分析
为研究居民家庭教育支出和消费性支出之间的关系,收集到1978年至2002年全国人均消费性支出和教育支出的数据。
首先绘制教育支出和消费性支出的散点图。观察散点图发现两变量之间呈非线性关系,可尝试选择二次、三次曲线、复合函数和幂函数模型,利用曲线估计进行本质线性模型分析。其中,教育支出为被解释变量,消费性支出为解释变量。
现在学习的是第17页,共30页
2、分析和预测居民在外就餐的费用
利用收集到1978年至2002年居民在外就餐消费的数据,对居民未来在外就餐的趋势进行分析和预测。
首先绘制就餐费用的序列图,选择菜单Graphs-Sequence。得到的序列图表明自80年代以来居民在外就餐费用呈非线性增加,90年代中期以来增长速度明显加快,大致呈指数形式,可利用曲线估计进行分析。由于要进行预测,因此在曲线估计主窗口中要单击Save按钮,出现如下窗口:
现在学习的是第18页,共30页
现在学习的是第19页,共30页
Save Variables框中:Predicted values表示保存预测值;Residual表示保存残差;Prediction interval表示保存预测值默认95%置信区间的上限和下限值。
Predict cases框中:只有当解释变量为时间时才可选该框中的选项。Predict from estimation period through last case表示计算当前所有样本期内的预测值;Predict through表示计算指定样本期内的预测值,指定样本期在Observation框后输入。
本例希望预测2003年和2004年的值,应在Observation框后输入27。
现在学习的是第20页,共30页
线性回归的衍生模型
在线性回归模型中如果遇到异方差、多重共线形和序列相关等问题,必须通过相应的模型改进以消除,才能进行解释和实际应用。以下简单介绍3个衍生模型及其在SPSS中的实现。
加权最小二乘法(解决异方差问题)
岭回归(解决多重共线性问题)
最优尺度回归(解决自变量为定类或定序的问题)
在解决序列相关问题中,最直接和简单的方法就是加入新的自变量,一般可以加入初次回归的残差处理。
现在学习的是第21
回归分析下 来自淘豆网m.daumloan.com转载请标明出处.