第四讲回归分析回归诊断.ppt回归模型的诊断
通过简单回归和多元回归模型可以有了计算结果。
这些结果能做推断,需要建立在一些概述性统计量的基础之上,这些统计量由数据来计算。而只有当标准的回归假定满足时,所做的推断才有可能是合理的,有意义的。而对假定的核定,可以用图形的方法,也可以用严格的数值去检查。
数据也需要考虑
还有模型的设定
标准的回归假定:
1,关于模型设定的假定
2,关于误差的假定
3,关于预测变量的假定
非随机的
其取值是误差取得的,但几乎不可能。测量误差将影响到误差方差,相关系数,复相关系数及回归系数的估计,其影响程度的大小取决于多个因素。
是线性无关的
4,关于观测的假定
所有观测是同样可靠性
数据的诊断 异常值 强影响点 假定是否满足模型的诊断
6
线性回归模型中的异常点分析
异常点的识别与处理,是统计诊断中很重要的一项内容。
异常点的出现会影响分析结果的可信度。
异常点的存在往往蕴涵着重要的信息。
在有些情况下,异常点的出现是因为有新事物出现或者新情况发生,比如经济模型中某种经济政策的出台等,都能表现出异常,这通常是我们的研究兴趣所在。
在另外一些情况下,异常点的出现是由于人为差错或者仪器的故障所引起的。
在我们需要根据样本对模型进行参数估计或者根据模型对将来进行预测与控制的时候,异常点的出现会对我们的工作产生很强的影响,这样的结果是令人怀疑的。
因此,异常点的研究受到了广大研究者的重视,自Bernoulli首次提出了异常点的概念,接下来对异常点的概念、类型以及处理问题的讨论一直没有停止过。
异常点的成因与处理
为什么会出现异常点?对这个问题的回答大致可以归结为以下三种情况:整体模型变化、局部模型变化和自然变异。
在前两种情况下,异常点出现的多而且连续,往往蕴涵着机制的变化、新事物的出现或者新局面的形成,大量而且连续的异常点可以用新的模型来拟合。对于整个数据集,实质上已经成为一个混合模型。
而第三种成因更为常见,偶尔的人为差错或者仪器的故障都可以引起异常。
对于由不同的原因引起的异常点,它们的处理方法是不同的。在进行统计诊断时,判断异常点的成因是很重要的,是对异常点进行正确处理的先决条件。
通常对异常值的处理方法有两种。一种是把异常点作为工作重点,目标就是发现异常点并确定是否要作进一步的研究,这样的异常点往往含有很重要的信息。这时不仅要判断出异常点的存在与否,还要确定异常点出现的位置以及影响大小。这是统计诊断中一个重要内容,围绕此类问题出现了大量的统计量检验方法及影响分析研究。
第四讲回归分析回归诊断 来自淘豆网m.daumloan.com转载请标明出处.