第十章相关与回归分析
第一节简单线性相关分析
一、简单线性相关(直线相关)的概念:
二、相关关系的种类:
(一)按相关程度划分可分为完全相关、不完全相关、和不相关
(二)按相关方向划分可分为正相关和负相关
(三)按相关的形式划分性:是指反应变量Y的总体平均值与自变量X呈线性关系;
2)独立性:任意两个观察值之间相互独立;
3)正态性:是指对于给定的X值,其对应的Y值的总体和线性模型的误差项£均服从正态分布;(£均服从均数为0的正态分布)
4)等方差性:无论X如何取值,Y都有相同的方差。
回归方程的显著性检验
检验自变量和因变量之间的线性关系是否显著。具体方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用F检验来分析二者之间的差别是否显著,如果是显著的,两个变量之间存在线性关系;如果不显著,两个变量之间不存在线性关系。
•SS总=SS回+SS剩
SS为回归平方和,它反映在Y的总变异中,由于X与Y的直线回
关系,而使得Y变异减小的部分,也即在总平方和中可以用X解释的部分。SS越大,说明回归效果越好。
回
SS为剩余平方和,它反映X对Y的线性影响之外的因素,对Y乘匚
的总变异的影响,也即在总平方和中无法用X解释的部分oSS越小,
乘J说明直线回归的估计误差越小。
回归系数的显著性检验
bt二-Sb1
对于一元线性回归,回归方程的显著性检验与回归系数的显著
性检验是等价的。可通过方差分析或t检验进行。
三、相关与回归分析应用注意事项
2.直线相关与回归的区别与联系
(1)区别:
相关分析要求两个变量均服从正态分布,而回归分析则有两种不
同的模型。I型回归:定X后对y进行测量,y须服从正态分布;II型回归:x,y均须服从正态分布,如体重依身高的变动关系。
对于同一资料,只能计算一个相关系数,而II型回归可以计算由x推y和由y推X的两个回归方程,但两者不是反函数的关系。
回归反映两变量间的依存关系,相关反映两变量间的相互关系。有相关联系不一定是因果联系。
(2)联系:
同一资料r与b符号相同。
同一资料r与b的假设检验结果是等价的。
r与b可以互相换算。
相关是相互关系,双方向,-lWrW+l,无单位,有相关不一定有回归;回归是依存关系,单方向,无限,有单位,有回归一定有相关。
第三节秩相关
秩相关又称等级相关,是一种用等级数据进行直线相关分析的非参数统计方法,适用于双变量不服从正态分布的资料;总体分布型未知;等级资料或无确切数值资料。
秩相关用等级相关系数r表示密切程度及方向。其取值范围为-1
WrW+1;r〉0为正相关,rV0为负相关;r=0,表示无线性相关关系,为零相关。
第十一章
多重线性回归
一.基本概念:
多重线性回归的概念:
1.多重线性回归是研究多个自变量与一个因变量之间线性依存关系的方法。
2.多重线性相关(复相关)是研究多个变量与一个变量线性相关关系的方法。
3.多元线性回归是研究多个自变量与多个因变量线性依存关系的方法。
4.多元线性相关是研究多个变量与多个变量之间线性相关关系的方法。
5.偏相关是研究在多个变量中消除其它变量影响后一变量与另
一变量的相关关系。
二、多重线性回归模型
意义:多重线性回归模型用于研究一个被解释变量(因变量)
受多个解释变量(自变量)的影响,多重线性回归模型与一元线性回
归模型基本类似,只不过解释变量由一个增加到两个以上,被解释变量y与多个解释变量x,x・・・x之间存在线性关系。
12k
2.模型与方程:
•假定被解释变量y与多个解释变量x,x・・・x之间具有线性关12k
+Bx+8)
01
系,建立多重线性回归模型为:
y=B+Bx+Bx+・・・+Bx+8
01122kk
其中y为被解释变量,x为k个解释变量,B为偏(部分)回归jj
系数,£为随机误差项。
•被解释变量y的期望值与解释变量x的多重线性回归方程为:
F=a+bX+bX++bX
1122kk
参数估计的方法:
一般需要计算机软件完成。如以儿子身高为
因变量,父、母身高和体育锻炼次数为自变量,建立方程如下
Y=++
123
3.多重线性回归模型的假设(条件):
1、因变量Y和解释变量X之间是线性关系;
2、X是自变量,并在两个或多个自变量之间没有精确的线性关
系;
3、误差项的所有观测值的期望值为0,方差相等;
4、误差项的观测值之间相互独立,不相关;
5、误差项服从正态分布。
三、参数与参数估计:
1.参数估计方法:参数估计方法是最小二乘法。一般用统计软件完成。
2•偏回归系数B
线性相关与回归分析 来自淘豆网m.daumloan.com转载请标明出处.