下载此文档

多元回归.docx


文档分类:高等教育 | 页数:约6页 举报非法文档有奖
1/6
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/6 下载此文档
文档列表 文档介绍
第二节多元回归
多元回归是通过许多预测源去预测一个结果。多元回归用于决定一个被预测变量和两个及两个以上预测变量组合之间的关系。它是教育研究中最常用的统计技术。多数定量研究设计,如因果比较、相关和实验等的数据都可以用它进行分析。它处理等距数)。此外,即使人多数检验(特别是F检验)对此假设要求严格,为了检验残差值的分布,可以产生标准化残差常态几率柱状图。
(三)共线性。当自变量高度相关(r>)时,会出现共线性。共线性会增加”系数的标准误,评估每个难于独立的角色,要评估共线性,可以将所有预测因子进行配对相关分析。对于多重共线性(多个预测因子间的共线性),可以进行每个预测因子对其他预测因子的回归分析。Tolerance和VIF可以测量共线性。
Tolerance是指在不考虑因变量情况卞,每个自变量对所有其他自变量进行回归后的1一疋。预测因子间的相关越高,Tolerance越接近于0。根据经验法则,,就存在多重共线性问题(变量和其他预测因子间的共线性高,卢系数不稳定)。
变异膨胀因素(VIF)是Tolerance的倒数。因此,当VIF高,则多重共线性高,9系数不稳定。在SPSS结果部分,VIF和Tolerance通常是共线性统计量。在决定自变量是否存在人的多重共线性时,VIF左4是一个自定但通用分隔标准(值大于4则表明存在多重共线性问题)。有一些研究者也使用更宽松的分隔标准即VIFM5。
四、离群值
即使人多数多元回归的假设都不能精确测量,但是总的违规还是可以检测出来并进行恰当处理的。特定的离群值(即极端值)可以通过向特定方向“拉”或“推”回归线,,导致偏回归系数。通常,排除一个极端值可以产生一个完全不同的结呆。标准化残差也通过高杠杆作用发现离群值。在残差图中,町以通过加减两个标准差划线以突出95%置信区间外的数据。
如果标准残差>2或<-2,可能存在离群值。因为基于正态概率,%的机会标准残差会>2或
如果标准残差><-,那么可能就是离群值。%的机会可能><-
偏回归图,也叫偏回归杠杆图或附加变量图,用于侦测有影响的因子。偏回归图是一系列因变量和每个自变量依次的双变量回归图。图中不用点,而是用数字或标记显示个体。需要在所有图中找到个体离群值。
五、分类变量的再编码
只有两种分类的分类变量可以包括在没有引入因子的多元回归等式中。预测因子详细说明回归表面包扌舌两个平行超平面。回归系数的符号决定哪个平面在另一个之上,而系数犬小则决定它们之间的距离。
当超过两个分类的分类变量置于回归模型中时,就要进行重新编码。可以从三个组的t检验归纳出回归模型。简单线性回归模型如下:
Y=b°+%X
式中X是分类预测因子,取值分别为1,2,3,即X=l,2,3。但是数字代表分类,如仅物、药品或肥料种类等。模型给出恰当的值。
•第一类:y=b0+S
•第二类:y=b0+2们
•第三类:y=b0+3$
模型强制为预测值安排了特定顺序。第二类的预测值必须位于第一类和第三类正中间。然而,分类标签通常是任意选择的。中间代码组不能是最人组和最小组的平均值。如要决定分类是否不同,将分类变量的数字编码当成真正的数字模型是错误的。
一种决定g个

多元回归 来自淘豆网m.daumloan.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
最近更新