第3 章 多元线性回归
思考与练习参考答案
见教材 P64-65
,它们对模型的参数估计
有何影响?
答:在多元线性回归模型中,样本容量n与自变量个数p的关系是: n>>p。如果n〈第3 章 多元线性回归
思考与练习参考答案
见教材 P64-65
,它们对模型的参数估计
有何影响?
答:在多元线性回归模型中,样本容量n与自变量个数p的关系是: n>>p。如果n〈二p对模型的参数估计会带来很严重的影响。因为:
,有p+1个待估参数B,所以样本容量的
个数应该大于解释变量的个数,否则参数无法估计。
,要求rank(X) = p +1 <n,表明设计矩阵
X 中的自变量列之间不相关,即矩阵 X 是一个满秩矩阵。若
rank(X) < p +1,则解释变量之间线性相关,(XX)-1是奇异阵,则0 的估计不稳定。
3・3证明CT 2 = SSE■: (n - p -1)随机误差项£的方差b2的无偏估计。 证明:
•••6 2 = ―1— SSE = ―1— (e'e) = —1—工 e2,
n — p — 1 n — p — 1 n — p — 1 i
i=1
・•・E(工 e2)=工D(e )=工62(1— h ) =62工(1— h ) =62(n-工h ) =62(n — p — 1)
i i ii ii ii
i=1 i=1 i=1 i=1 i=1
E(62) = —1— E(He2) =62 n—p—1 i
i=1
一个回归方程的复相关系数R=0・99,样本决定系数R 2=,
我们能断定这个回归方程就很理想吗? 答:不能。复相关系数R与样本决定系R 2数都是用来表示回归方程
对原始数据拟合程度的好坏。样本决定系数取值在【0,1】区间内, 一般来说,R2越接近1,即R2取值越大,说明回归拟合的效果越好。 但由于
R2的大小与样本容量n和自变量个数p有关,当n与p的值 接近时,R2容易接近1,说明R2中隐含着一些虚假成分。而当样本 容量n较小,自变量个数p较大时,尽管R2很大,但参数估计效果 很不稳定。所以该题中不能仅仅因为R2很大而断定回归方程很理想。 ,接受H0 ? 答:一般来说,当接受假设H0时,认为在给定的显著性水平a之下, 自变量x , X2,…,Xp对因变量y无显著性影响,则通过x , x2,…,Xp 去推断 y 就无多大意义。此时,一方面可能该问题本应该用非线性模 型描述,我们误用线性模型描述了,使得自变量对因变量无显著影响; 另一方面可能是在考虑自变量时,由于认识上的局限性把一些影响因 变量y的自变量漏掉了,这就从两个方面提醒我们去重新考虑建模问 题。
当拒绝H 0时,也不能过于相信该检验,认为该模型已经很完美。其 实当拒绝H时,我们只能认为该回归模型在一定程度上说明了自变量 x , x2,…,二与因变量y的线性关系。因为这时仍不能排除我们漏掉 了一些重要自变量。此检验只能用于辅助性的,事后验证性的目的。
(详细内容可参考课本P95〜P96评注。)
数据中心化和标
应用回归分析 来自淘豆网m.daumloan.com转载请标明出处.