第章线性回归分析详解演示文稿
第一页,共五十二页。
优选第章线性回归分析
第二页,共五十二页。
“回归”(高尔顿)描述父亲的身高方程
拟合优度的检验采用R2统计量,称为判定系数
R2=SSA/SST=1-SSE/SST.
R2体现了回归方程所能解释的因变量变差的比例;1-R2体现了回归方程所无法解释的变差比例。
第十六页,共五十二页。
R2越接近于1,则说明回归平方和占了绝大部分比例,因变量y的变差主要由自变量x的取值造成,回归方程对样本数据点拟合得好
在一元线性回归中,判定系数R2=相关系数r2; 因此,从这个意义上讲,判定系数能够比较好地反映回归直线对样本数据的代表程度和线性相关性。
说明
第十七页,共五十二页。
二、多元线性回归方程
多元线性回归方程的拟合优度检验采用统计量 ,称为调整的判定系数
调整的判定系数:判定系数受解释变量X的个数p的影响,在p的个数不同的模型之间进行比较时,判定系数必须进行调整。
第十八页,共五十二页。
用于检验被解释变量与所有解释变量之间的线性关系是否显著,用线性模型来描述它们之间的关系是否恰当,即检验模型对总体的近似程度。
SST =回归平方和 SSA + 剩余平方和SSE
回归方程的显著性检验中采用方差分析的方法,研究在SST中SSA相对于SSE来说是否占有较大比例。如果比例较大,表明y与x全体的线性关系明显,则利用线性模型反映y与x的关系是恰当的;反之,不恰当。
第十九页,共五十二页。
原假设H0: β1 =0 .即:回归系数与0无显著差异
利用F检验,构造F统计量:
F~F(1,n-2)
判断:若 p<a,则拒绝H0 ,模型的线性关系是显著的;反之,模型的线性关系不显著.
一、一元线性回归方程显著性检验
第二十页,共五十二页。
原假设H0: β1 = β2=…. =βp = 0 .即:各个回归系数同时与0无显著差异
利用F检验,构造F统计量:
F~F(p,n-p-1)
判断:若 p<a,则拒绝H0 ,模型的线性关系是显著的;反之,模型的线性关系不显著.
二、多元线性回归方程的显著性检验
第二十一页,共五十二页。
R2检验与F检验的关系
F是R2的单调增函数,Fα与 一一对应。
R2
F
Fα
图1 F统计量与R2的关系
第二十二页,共五十二页。
主要目的是研究回归方程中每个解释变量与被解释变量之间是否存在显著的线性关系。
即研究每个解释变量能否有效的反映被解释变量的线性变化,它们能否保留在线性回归方程中。
回归系数的显著性检验是围绕回归系数估计值的抽样分布展开的,构造统计量,并进行检验。
第二十三页,共五十二页。
一、一元线性回归方程显著性检验
回归系数的显著性检验:t检验
H0:β1=0 ,即:回归系数与0无显著差异,利用t检验:
第二十四页,共五十二页。
若 p<a,拒绝H0,y和x线性关系显著,应保留在方程中;
若 p>a,不能拒绝H0, y和x线性关系不显著。
一元线性回归方程的检验和回归系数的检验是等效的。
第二十五页,共五十二页。
需要对回归系数是否为零逐一进行检验。
原假设H0:βi=0 ,即:第i个偏回归系数与0无显著差异
利用t检验统计量(略)
若与t统计量的概率伴随p <a,则拒绝H0
多元线性回归中回归系数的检验与整体回归方程的检验不能相互替代。
二、多元线性方程回归系数的检验
第二十六页,共五十二页。
残差指由回归方程计算所得的预测值与实际样本值之间的差距,即模型中εi 的估计值:
回归模型要求:残差序列中不含明显的规律性和趋势性,均值为零、正态分布、等方差,且序列是独立的。
第二十七页,共五十二页。
一、残差均值为零的正态分析
可以通过绘制残差散点图来观察:如果残差的均值为零,残差图中的点应在纵坐标为零的横线上下随机散落,如下图。
第二十八页,共五十二页。
二、残差的独立性分析(非自相关)
残差是独立的,则残差序列应满足cov(εi , εj)=0(i≠j),表示残差序列前期和后期之间不存在相关关系,即不存在自相关。独立性检验方式:
第一、绘制残差序列图(下图残差随时间的推移,呈有规律变化,表明残差序列存在一定的正或负自相关)
第二十九页,共五十二页。
自相关系数用于测定序列自相关强弱,其取值范围-1~+1,接近1表明序列存在正自相关
第二、计算残差的自相关系数
第三十页,共五十二页。
DW检验
线性回归分析详解演示文稿 来自淘豆网m.daumloan.com转载请标明出处.