第八章单因素方差分析§ 方差分析的基本原理例有5组数据要比较,若一对一对的比较,则共需比对。假设每一对接受H 0正确的概率为=,而且这些检验都是独立的,那么 10对都接受的概率,因此,,这显然是不能接受的。方差分析(analysis of variance, ANOVA)是一种特殊情况下的统计假设检验,是多组数据之间平均数差异的显著性检验。 t 检验可以判断两组数据平均数间的差异显著性,而方差分析则可以同时判断多组数据间的差异显著性。对多组数据若仍用前面介绍的t 检验进行一对对的比较,会大大增加犯第I类错误的概率。 方差分析的一般概念 10 2 4 5 25 ??? C 1 ???? 10 ? 1 ??? ??方差分析是将各组数据放在一起,一次比较就对所有各组间是否有差异作出判断。如果没有显著差异,则认为它们都是相同的;如发现有差异,再进一步比较是哪组数据与其他数据不同 方差分析中常用到的术语 (factor) 可能影响试验结果,且在试验中被考查的原因或原因组合。有时也可称为因子。 (level) 因素在试验或观测中所处的状态。 。一个因子第i水平上所有数据的平均与全部数据的平均之差,称为该因子第i水平的主效应。 。 。 ,且水平固定后,其效应也固定。 ,或虽水平能控制,但其效应仍为随机变量。如动物的窝别(遗传因素的组合),农家肥的效果,等等。 ,其他原因所引起的实验结果的变化。它可分为系统误差和随机误差。系统误差:误差的组成部分,在对同一被测量的多次测试中,它保持不变或按某种规律变化。它的原因可为已知,也可为未知,但均应尽量消除。随机误差:误差的组成部分,在对同一被测量的多次测试中,它受偶然因素的影响而以不可预知的方式变化。它无法消除或修正。例调查5个不同小麦品系的株高,结果如下: 株号品系 I II III IV V 1 2 3 4 5 和 平均数 其中仅出现“品系”这样一个因素,故称为单因素。共有5个不同的品系,称品系这一因素共有5个水平。5个品系可以认为是5 个总体,表中数据是从5个总体中抽出的5个样本,通过比较来判断这5个总体是否存在差异。上述试验中只有一个因素,该因素有a个处理(treatment),这样的实验称为单因素实验。从单因素实验的每一个处理所得到的结果都是一随机变量。对于a个处理,各重复次(或做次观测)的单因素方差分析的一般表示法见下表 i X n n 1X 2X ?? iX ?? aX 11x 21 x 1ix 1ax 单因素方差分析的典型数据表中数据的固定表示法和符号所表示的意义如下: :因素的水平数:每一水平的重复数:第i水平的第j次观察值。1≤i≤a,1≤j≤n ,第i水平所有观察值的和,第i水平均值,全部观察值的和,总平均值,第i水平上的子样方差。 a n ij x ??? n i j i i x x 1 . . 1 . i i x n x ?????? a i n i ij x x 1 1 .. .. 1 .. x an x ? 22 1 1 . ( .) 1 n i ij i i s x x n ?????单因素方差分析(one-factor analysis of variance):指需要研究的因素仅一个(或只有一组分组),该因素可有几个不同水平,分析的目标是看这些水平的影响是否相同。在有随机误差的情况下,各水平应有重复。方差分析中常用线性统计模型(linear statistical model)描述观察值: , ,
第八章单因素方差分析 来自淘豆网m.daumloan.com转载请标明出处.