线性回归(huíguī)的常见问题
多重共线性
异方差(fānɡ chà)性
自相关性
第1页/共82页
第一页,共83页。
多重共线性 (gàiniàn)
i=1,2,…,n
其基本假设之一是解释(iàng)间就容易产生共线性。所以,我们在运用回归分析研究经济问题时,要尽可能使样本容量远大于自变量(biànliàng)个数。
第13页/共82页
第十三页,共83页。
时间(shíjiān)序列数据、线性模型:将原模型变换为差分模型:
Yi =1X1i+2 X2i ++k Xki+ i
可以相对有效地消除原模型中的多重共线性。
一般(yībān)讲,增量之间的线性关系远比总量之间的线性关系弱得多。
第14页/共82页
第十四页,共83页。
例如(lìrú):
中国GDP与居民消费C的总量与增量数据
Year
GDP
CONS
CONS/GDP
ΔGDP
ΔCONS
ΔCONS / ΔGDP
1980
NA
2976
NA
NA
NA
NA
1981
4901
3309
NA
333
NA
1982
5489
3638
588
329
1983
6076
4021
587
383
1984
7164
4694
1088
673
1985
8792
5773
1628
1079
1986
10133
6542
1341
769
1987
11784
7451
1651
909
1988
14704
9360
2920
1909
1989
16466
10556
1762
1196
1990
18320
11362
1854
806
1991
21280
13146
2960
1784
1992
25864
15952
4584
2806
1993
34501
20182
8637
4230
1994
47111
27216
12610
7034
1995
59405
34529
12294
7313
1996
68498
40172
9093
5643
第15页/共82页
第十五页,共83页。
由表中的比值可以直观地看到,增量(zēnɡ liànɡ)的线性关系弱于总量之间的线性关系,可以部分克服共线性的问题。
进一步分析:
GDP与CONS(-1),
△GDP与△CONS(-1)
一般认为,,二者之间存在强烈的线性关系。
原模型和差分模型经过检验(jiǎnyàn)都具有多重共线性,但程度不同。
第16页/共82页
第十六页,共83页。
命令(mìng lìng)
Ls d(y) d(x1) d(x2) ….d(xp)
Ls y-y(-1) x1-x1(-1) x2-x2(-1)…xp-xp(-1)
第17页/共82页
第十七页,共83页。
(dìngyì)方程
、人均机动车数量、人均国民生产总值和油价这四个变量建模。取消原模型中的人口数变量。由于(yóuyú)减少了变量, 也就降低了发生共线性的可能性。
第18页/共82页
第十八页,共83页。
(gūjì)
岭回归(huíguī)法
主成分法
偏最小二乘法
差分法
第19页/共82页
第十九页,共83页。
(fānɡ chà)的概念
即对于不同的样本(yàngběn)点,随机误差项的方差不再是常数,则认为出现了异方差性。
异方差(fānɡ chà)性
第20页/共82页
第二十页,共83页。
21
异方差就是对同方差假设的违
线性回归问题与非线性回归分析学习教案 来自淘豆网m.daumloan.com转载请标明出处.