(一)原理
一、基本思想
在实际问题中,有些随机因素是很难人为控制的,但它们又会对 结果产生显著影响。如果忽略这些因素的影响,则有可能得到不正确 的结论。这种影响的变量称为协变量(一般是连续变量)。
例如,研究3种不同的教学方法的教学效果的好坏。 检查教学效 果是通过学生的考试成绩来反映的,而学生现在考试成绩是受到他们 白身知识基础的影响,在考察的时候必须排除这种影响。
协方差分析将那些难以控制的随机变量作为协变量,在分析中将
其排除,然后再分析控制变量对于观察变量的影响, 从而实现对控制 变量效果的准确评价。
协方差分析要求协变量应是连续数值型, 多个协变量间互相独立,且 与控制变量之间没有交互影响。前面单因素方差分析和多因素方差分 析中的控制变量都是一些定性变量,而协方差分析中既包含了定性变 量(控制变量),又包含了定量变量(协变量)。
协方差分析在扣除协变量的影响后再对修正后的主效应进行方差分
析,是一种把直线回归或多元线性回归与方差分析结合起来的方法, 其中的协变量一般是连续性变量,并假设协变量与因变量间存在线性 关系,且这种线性关系在各组一致,即各组协变量与因变量所建立的 回归直线基本平行。
当有一个协变量时,称为一元协方差分析,当有两个或两个以上的协 变量时,称为多元协方差分析。
二、 协方差分析需要满足的条件
白变量是分类变量,协变量是定距变量,因变量是连续变
量;对连续变量或定距变量的协变量的测量不能有误差;
协变量与因变量之间的关系是线性关系,可以用协变量和因变
量的散点图来检验是否违背这一假设; 协变量的回归系数(即各回归 线的斜率)是相同的,且不等于 0,即各组的回归线是非水平的平行 线。否则,就有可能犯第一类错误,即错误地接受虚无假设;
白变量与协变量相互独立,若协方差受白变量的影响,那么协 方差分析在检验白变量的效应之前对因变量所作的控制调整将是偏 倚的,白变量对因变量的间接效应就会被排除;
各样本来白具有相同方差 /的正态分布总体,即要求各组方差 齐性。
三、 基本理论
观测值=均值+分组变量影响+协变量影响+
Yij u ti (* X) ij (1)
其中,X为所有协变量的平均值。
注:在方差分析中,协变量影响是包含在随机误差中的,在协方差分 析中需要分离出来。
用协变量进行修正,得到修正后的 yij(adj)为
Yij (adj) yij (Xij X) u ti ij
就可以对yij(adj)做方差分析了。关键问题是求出回归系数 &
总离差=分组变量离差+协变量离差+随机误差,
计算总离差平方和时,记 k n
Txy [〔(Xij x)(yij y) k n
— / 一、2
Txx (Xij X)
i 1 j 1 k n
总离差平方和:Tyy (yij y)2
最终要检验分组白变量对因变量有无显著作用。原假设 H0:无显著
作用。假设检验是在Ho为真条件下进行,可认为ti=0,则
yu u * x) j
按最小二乘法原理线性回归可得到 6的估计值
记修正的总离差平方和(残差平方和)为 Tyy(adj),则
T2
Tyy(adj) Tyy ?:Txx Tyy ,白由度为 ^2
T xx
注:?2Txx为回归平方和,若?T 0 (回归线为水平线),表示协变量
x对y无作用,用方差分析就可以解决了。
计算组内离差平方和时,记 k n
Exy (xij xi)(yij yi)
i 1 j 1
k n
Exx (xij xi)2
组内总离差平方和:Eyy (yij yi)2
根据协方差分析的基本假设:各组内回归系数相等(做协方差分析时 需要检验这一点),得到组内回归系数⑶的估计值
? Exy
w E
xx
记修正的组内总离差平方和(组内残差平方和)为 Eyy(adj),则
E2 、
Eyy(adj) Eyy ?WExx Eyy 广,白由度为 hkl
其中,?2Exx为组内回归平方和,当
Wi L 侦时,组内总离差平
方和认为完全是由随机因素引起的,Eyy(adj)就是随机为误差。这里的七 是?Wi,L ,"的加权平均值。
计算分组变量离差平方和Byy(adj),它反映的是各个水平之间的差
异。
Byy(adj) Tyy(adj) Eyy(adj) Tyy T Txx Eyy(adj)
即,分组变量离差=总离差-协变量离差-随机误差 于是,就可以进行组间无差异检验了 :
F Byy(adj)/k 1
Eyy(adj) / n k 1
因此,在做协方差分析前,需要依次做两个假设检验:
协变量对因变量的影响对与各组来说都是相同的,即
SPSS学习系列23.协方差分析 来自淘豆网m.daumloan.com转载请标明出处.