摘要
本文主要介绍线性模型的数据变换以及相应的参数估计和假设检验方法。第一章主要介绍了数据处理方法的背景及其方法,并进一步阐述数据处理方法的方差稳定化变换和线性化变化方法。第二章主要介绍了数据处理方法的因变量Box-Cox变换方法,研究了Box-Cox变换下的线性模型中的参数进行了估计。第三章是在第二章的基础上对其参数估计进行假设检验,利用似然比统计量和score统计量以及Atkinson检验统计量进行数据变换模型的假设检验。第四章系统研究了数据变换模型的统计诊断,研究了模型的影响分析,并推导除了数据删除模型的参数估计公式,证明了数据删除模型(CDM)与均值漂移模型(MSOM)的等价性。
关键词:Box-Cox变换; 线性模型; 诊断; 参数估计
Abstract
试试事实上
Keywords: Box-Cox transform; linear model; diagnosis; parameter estimation
目录
摘要 I
ABSTRACT II
目录 III
第1章绪论 1
问题的提出 1
2
本文的主要工作 3
第2章线性模型的参数估计 4
Box-Cox变换 4
4
7
7
8
第3章线性模型的假设检验 9
9
10
11
第4章数据变换模型的统计诊断 11
12
13
16
17
基于数据删除模型的广义Cook距离 18
基于数据删除模型的似然距离 19
第5章线性模型数据变换统计诊断实例 24
24
参考文献 28
第一章绪论
随着现代科学技术的迅猛发展,统计分析理论也在不断的发展和完善。在统计分析过程当中,建立数学模型是一个十分重要的研究课题,如炼钢厂的工程师希望有一个炼钢过程的数学模型,以实现计算机自动控制;气象研究工作者要根据气压、雨量、风速的数学模型来预报天气;从事城市规划工作的专家们更需要建立一个包括人口、交通、能源、污染大系统的数学模型,为领导者做出城市发展规划决策提供可靠的科学依据。在复杂系统中,具有很多不确定的因素,建立数学模型时经常使用概率统计模型;从而统计推断方法成为统计分析中极其重要的分析方法。通常人们习惯应用回归分析的手段来处理这类问题。回归分析的理论及方法发展得非常快,它不仅已成为统计学的一个重要分支,而且也被人们广泛地应用也各个领域。随着回归分析理论的不断发展,线性回归模型已成为目前重要的研究课题。其中对数据的处理方法尤其显得重要。本章第一节主要阐述数据处理的方法及背景;第二节则简要介绍关于上述数据处理方法下的模型的研究现状。
统计诊断就是对从实际问题中收集起来的数据和提炼出来的模型以及由此出发所作的推断方法的合理性进行深入细致的分析,并通过一些诊断统计量来检查数据、模型及推断方法中可能存在的“毛病”,进而提出“治疗”方案。在几乎所有的统计诊断问题中,都将涉及到两个基本概念:异常点和强影响点。面对诊断后的数据,我们应当采取有效的“治疗”措施。近年来的实践证明,数据变换是处理有问题数据的一种好方法,它对许多数据都是行之有效的,特别是对异常点较多的模型,其效果更佳。
给定一组数据若用模型进行拟合,则要求数据满足以下条件:
线性条件,即因变量的数学期望和为之参数之间具有线性关系:;
方差齐性,即误差项;
正态性,在某些情况下要求服从正态分布;
其中。为阶满之矩阵,其第行为。
如果某些数据不全部满足上述三个条件,它们之中就可能出现异常点。如果异常点较多,就不能坚定地加以删除,必须对数据和模型本身进行研究。实践证明,通过数据变换能找出更合适的新的回归模型,在该回归模型中,原来的异常点(或至少大部分异常点)将变为正常点。
数据变换的方法有很多种,但它们大致可划分为两大类,一类为方差稳定化变换和线性变换。它们的共同特点是,通过数据的实际背景或残差分析等方法,可以大致确定因变量的方差或期望与自变量的函数关系,对于一些特殊的函数关系,可以对因变量或自变量进行相应的变换,使得变换后的数据能满足上述的三个条件。另一类为数据的Box-Cox变换对许多实际数据都是行之有效的,它可以明显地改进数据的异方差性、非对称性和非正态性。该变换在各方面得到广泛的应用,至今仍是许多统计学家十分关心的课题。
(时修改)兰)中_文_摘_要 来自淘豆网m.daumloan.com转载请标明出处.