楚雄师范学院
2012年数学建摸模拟论文
题目应用回归分析
姓名韩金伟
系(院) 数学系09级01班
专业数学与应用数学
2012 年8月 22 日
题目:应用回归分析
摘要:随着社会经济的不断发展,科学技术的不断进步,统计方法越来越成为人们必不可少的工具和手段。应用回归分析是其中的一个重要分支,数据处理,数据检验,模型的建立和检验都是回归分析不可缺少的部分。针对多组数据的多个变量样本,我们通常都会对它建立回归模型,在此建模过程中我们就要对给定的数据做合理化检验分析,找出数据的规律,再对数据进行分类建模。当然,因为各变量之间或多或少都会存在强影响的变量,所以通常都要做剔除性检验和重新建模,最后建立出一个合理化的模型。
关键词:回归分析相关性自相关残差异常点正态性杠杆值
一、问题重述
( 附录一)中给定了一些关于自变量与因变量的一些数据,请按所给的要求对给定的数据进行分析:
要求:,并求出杠杆值.
.
.
,若有多重共线性,试消除,再建模.
,模型的合理性分析.
.
问题分析
本题是要针对一组数据做合理化的线性分析,先后要求对数据做了异常值的检验和剔除,各变量的正态性检验,在从相关性的角度对各变量做相关性检验,得出数据是否适合做多元线性规划模型。为了使建立的模型具有很好的拟合效果和实际意义,又要求对各变量做相关性检验的同时进而做多重共线性的诊断,从中发现自变量之间是否存在着多重共线性。在有多重共线性的情况下,为了消除多重共线性的影响,我们又要做剔除不合理的变量再做回归模型。当然在做好的模型中,我们又要剔除不能通过t检验的变量,最后建立没有强多重共线性,没有异常点且通过了F检验,t检验的合理化模型,再对给定的数据做出预测。
模型假设
假设y为因变量,为自变量,y 因变量y,X1 自变量x1,X2 自变量x2,X3 自变量x3,X4 自变量x4,X5 自变量x5,X6 自变量x6, 第i个值的残差, 第i个值的学生化残差, 第i个值的删除残差, 第i个值的删除学生化残差, 第i个值的杠杆值, 平均杠杆值。
四、符号说明
符号
意义
符号
意义
id
序列号
第i个值的库克距离
y
因变量y
第i个值的马氏距离
X1
自变量x1
条件数
X2
自变量x2
X
矩阵
X3
自变量x3
系数
X4
自变量x4
VIF
方差扩大因子
X5
自变量x5
DW
DW检验
X6
自变量x6
条件索引
第i个值的残差
F
F检验
第i个值的学生化残差
t
T检验
第i个值的删除残差
平均数
第i个值的删除学生化残差
随机序列项
第i个值的杠杆值
S
样本偏度系数
平均杠杆值
B
样本峰度系数
五、模型建立和求解
1、问题一的求解
检测数据中的强影响点
对数据中的强影响点进行初略的箱图检
从绘制的箱图来看数据存在着强影响点,初步可以看出强影响点分别在的3号位和12号位,的34号位。为了进一步的检测出强影响点的位置和数据,减小强影响点对整体数据的影响,我们进一步对强影响点进行分析。
异常值分析
为了更好的检测出异常值,我们分别用计算机计算出数据的普通残差,学生化残差
,删除残差,删除化学生化残差,杠杆值,库克距离,见下表。
行
id
普通残差
学生化残差
删除残差
删除学生化残差
杠杆值
库克距离
MaHar距离
1
2
-
-
-
-
3
4
5
6
0
7
模拟建模论文(应用回归分析)spss 来自淘豆网m.daumloan.com转载请标明出处.