应用回归分析例库封面
案例名称:
民航客运量及相关因素分析
作者:
纪跃芝
教学目的:
掌握回归分析对实例进行基本分析。
适用课程:
应用回归分析
学习本案例的
前期知识准备:
回归分析、SPSS软件
本案例的知识点:
回归模型
一、案例背景
文章通过分阶段建立多元线性回归模型,分析了改革开放32年来民航客运量与相关因素之间的关系。结果表明:在不同历史阶段影响民航客运量的因素有所不同,并且从经济学角度对所建立的模型给出了合理的解释。
二、数据介绍
数据来自《新中国五十五年统计资料汇编》和《中国统计年鉴2010》。
三、分析过程
根据以上的分析,自改革开放以来,将中国民航客运量的增长趋势分为三个阶段,这里还有一个问题,就是年段的划分选在何处会更合理呢?对于这个问题,我们主要依据表2中分段回归拟合的残差平方和的大小,同时结合自变量选择时考虑的诸多因素做适当调整。
下面分阶段建立因变量关于自变量的各种组合的回归方程,这种组合方程共有
个,根据自变量的选择准则,从中选择最优回归方程。
第一阶段:1978~1988年最优回归模型
经过比较,在通过回归方程和回归系数的显著性检验的方程中(取显著性水平),发现表3中的两个模型最优。
由表3可见,模型一的各项指标都优于模型二,但是模型一中的系数,
与实际意义不符,最终消费与民航客运量应该正相关。模型二中的系数,与实际意义相符合,铁路客运量与民航客运量应该负相关,出现与实际意义不符的情况可能是由变量间的多重共线性造成的,为此考察其它几项指标,见表4。
表3 两个最优回归模型比较
模型 1978~1988年拟合回归方程 标准残差 复相关系数 PRESS AIC
模型一 26372。68 111。0539
模型二 46。03 52010。33
表4 多重共线性、异常值诊断
模型 方差扩大因子 绝对值最大的删除学生化残差 最大库克距离 最大杠杆值
模型一
模型二
从表4可见,模型一的自变量间存在严重的多重共线性,而且存在异常值点,模型二的自变量间不存在多重共线性,而且没有异常值点。为了进一步考察模型二的拟合效果,做残差图4和拟合图5。
图4 1978~1988年的拟合-残差图 图5 1978~1988年的最优回归拟合图
由图4可见,残差波动较小,介于—80~60之间,且无规律。图5表明模型二的拟合效果
相当好,最优回归方程对变量间的描绘是理想的。
第二阶段最优回归模型的确立
自变量的选择方法同上。
第二阶段:1989~2002年间,选入最优回归模型的变量是。
第三阶段:2003~2009年间,选入最优回归模型的变量是。
值得注意的是,在第三阶段,
回归模型拟合精度分析实用回归分析 来自淘豆网m.daumloan.com转载请标明出处.