逐步分析纳斯达克回归指数
逐步回归法建立纳斯达克股市指数回归模型
一 问题描述
为了研究纳斯达克股市的变化规律,建立回归方程,分析影响股票价格趋势变动的因素。这里我们选了3个影响股票价格指数的经济变量:x1是成交额(万$)j-1,Xj+1,…Xp);
……
Xp=f(X1,X1,…..Xp)
对上述p个方程进行参数估计,并计算样本决定系数。若这些决定系数中的最大者接近1,比如说,则说明该变量Xj可以用其他解释变量线性表示,则存在多重共线性。并且还同时找出了多重共线性的表达式。这种方法比较适合于解释变量少的模型。这种方法可以在SPSS软件上完成。
(2)条件数
被称为方差的条件数(Condition Number).利用条件数可以度量的特征根散布程度,可以用它来判断多重共线性是否存在以及多重共线性的严重程度。通常认为0<k<100时,设计矩阵X没有多重共线性;100<k<1000时,认为X存在较强的多重共线性;当k>1000,则认为存在严重的多重共线性。在SPSS软件中没有该方法。
(3)方差扩大因子
设为Xj对其余p-1个变量的复相关系数,则被称为方差扩大因子(Variance inflation Factor,简记为VIF)。如果记的方差仅差一个因子,是由两个因子和构成,且与OLSE的方差仅差一个因子。因为度量了自变量Xj与其余p-1个自变量的线性依赖度,这种相关程度越强,说明自变量之间的多重共线性越严重,就越接近1,VIFj也就越大。反之则相反。由此可见VIF的大小反映了自变量之间是否存在多重共线性,由此可由它来度量多重共线性的严重程度。经验表明,当VIF>10时,就说明自变量间有严重的多重共线性,且这种共线性可能会过度地影响最小二乘估计值。
以上三种方法都是诊断共线性是否存在的专门方法,相对这几种方法,还有一些在建模过程中能顺便主观判断的非正规方法。
3消除多重共线性的方法
当通过某种检验,发现解释变量中存在严重的多重共线性时,就要设法消除这种共线性。消除这种共线性的方法很多,常用的有下面几种。
(1)剔除一些不重要的解释变量。通常在经济问题的建模中,由于人们认识水平的局限,容易考虑更多的自变量。当涉及自变量较多时,大多数回归方程都受到多重共线性的影响。这时,最常用的办法就是舍去一些与y相关程度低、而与其他自变量高度相关的变量,然后重新建立回归方程。
(2)最大样本容量。建立一个实际经济问题的回归模型,如果所收集的样本数据太少,也容易产生多重共线性。这时可以通过增加样本容量来减弱多重共线性的程度。
(3)改变变量定义形式。对于样本数据是时间序列资料时,回归方程存在的多重共线性,我们可以重新定义变量的形式,差分法就是改变变量定义形式的一种方法。
(4)利用已知信息。即利用一些先验信息组合某些变量。例如模型中的两个参数b1和b2满足关系:b1=5b2,这时可将这个等式代入到原模型中,把模
型的变量综合到一起,再利用最小二乘法进行估计。
(5)回归系数的有偏估计。这种方法提出以引人偏误为代价来提高估计量稳定性的方差,如岭回法、主成分法、偏最小二乘法等。
(6)将截面数据与时序相结合。
(7)采用新的样本数据。在数据中重新抽取一个样本,有可能会减弱其中变量的多重共线性,因为数据样本的变化,往往会对方程的回归系数及其标准误差产生影响。
这些消除多重共线性的方法都可以在SPSS软件中间接完成。
四 数据分析与模型建立
1 对变量引入/剔除方式信息表的分析
表2 输入/移去的变量a
模型
输入的变量
移去的变量
方法
1
x3成交额
.
步进(准则: F-to-enter 的概率 <= .050,F-to-remove 的概率 >= .100)。
2
x1美元汇率
.
步进(准则: F-to-enter 的概率 <= .050,F-to-remove 的概率 >= .100)。
3
x2国际贸易金额
.
步进(准则: F-to-enter 的概率 <= .050,F-to-remove 的概率 >= .100)。
a. 因变量: y股票指数
通过逐步回归产生的三种模型1、2、3,模型1的自变量只有X3,模型2的自变量有X3和X1,模型3的自变量有X2、X3和X1。表2显示变量的引入和
剔除,以及引入或剔除的标准。逐步回归方法最先引入变量X3,建立模型1。接着引入变量X1,没有变量被剔除,建立模型2。最后引入X2,没有变量被剔除,建立模型3。
2 对模型汇总表的分析
表3 模型汇总
模型
R
R 方
调整 R 方
标准 估计的误差
更改统计量
Durbin-Watson
R 方更改
F更改
逐步分析纳斯达克回归指数 来自淘豆网m.daumloan.com转载请标明出处.