第9章方差分析介绍 1、方差分析的概念 2、方差分析的过程本章内容 方差分析的概念与方差分析的过程 单因素方差分析 单因变量多因素方差分析过程 多因变量线性模型的方差分析 重复测量设计的方差分析 方差成分分析 正交实验设计练习题(对银行数据进行方差分析) 方差分析的概念在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。通常是比较不同实验条件下样本均值间的差异方差分析是检验多组样本均值间的差异是否具有统计意义的一种方法。例如 n 医学界研究几种药物对某种疾病的疗效; n 农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响 n 不同饲料对牲畜体重增长的效果等都可以使用方差分析方法去解决方差分析基本原理认为不同处理组的均值间的差别基本来源有两个:?(1)随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示, 记作 SS w,组内自由度 df w?(2)实验条件,即不同的处理造成的差异, 称为组间差异。用变量在各组的均值与总均值之偏差平方和表示,记作 SS b,组间自由度 df b ?总偏差平方和 SS t、 SS b 、 SS w的公式 P147 方差分析基本原理(续) 组内 SS w、组间 SS b除以各自的自由度(组内 df w =n-m ,组间 df b =m-1 ,其中 n为样本总数, m为组数),得到其均方 MS w和 MS b,一种情况是处理没有作用,即各组样本均来自同一总体, MS b/ MS w≈1。另一种情况是处理确实有作用,那么, MS b >> MS w(远远大于)。 MS b/ MS w比值构成 F分布,用 F值与其临界值比较,推断各样本是否来自相同的总体. 方差分析的假设检验零假设 H 0:m组样本均值都相同,即μ 1= μ 2=....= μ m如果经过计算结果组间均方远远大于组内均方( MS b >> MS w), F>F ( dfb , dfw ) , p< , 拒绝零假设,说明样本来自不同的正态总体, 说明处理造成均值的差异有统计意义;否则, F<F (( dfb , dfw ) , p> 不能拒绝零假设,说明样本来自相同的正态总体,处理间无差异。 方差分析中的术语 1、因素与处理: 因素是影响因变量变化的客观条件;处理是影响因变量变化的人为条件。也可通称为因素。用分类变量表示,取有限的离散值 2、水平: 因素的不同等级称作水平。水平值取有限的离散值。如:性别中的 0,1(男、女) 等3、单元( cell) : 指各因素的水平之间的每个组合。如性别(0,1) 和年龄(10,11,12) 的六种组合。 方差分析中的术语(续) 4、因素的主效应和因素间的交互效应(如药物 A、B的主效应及 AB 的交互效应) 5、均值比较: n 均值的相对比较是比较各因素对因变量的效应大小的相对比较,如研究 A、B的单独效应之和是否等于它们的交互效应,或 A、B的效应是否相等。 n 均值的多重比较是研究因素单元对因变量的影响之间是否存在显著性差异。如 A、B的疗效是否存在显著性差异。 6、单元均值、边际均值: n 在多因素方差分析中,每种因素水平组合的因变量均值称为单元均值。一个因素水平的因变量均值称为边际均值( Marginal Means ) 方差分析中的术语(续) 7、协方差分析: 在一般进行方差分析时,要求除研究的因素外应该保证其他条件的一致。作动物实验往往采用同一胎动物分组给予不同的处理,研究不同处理对研究对象的影响就是这个道理。如研究身高与体重的关系时要求按性别分别进行分析, 以消除性别因素的影响。要消除其他因素的影响,应采用协方差分析。 8、重复测量: 组内变异的主要的原因是实验对象之间的个体差异。由于个体差异存在,即使实验对象受到相同的处理,他们的因变量值也可能相当不同。重复测量设计的方差分析也是像协方差分析一样,是在研究中减少个体差异带来的误差方差的一种有效方法,而且由于对相同个体进行重复测量,在一定程度上降低了人力、物力、财力的消耗。如果重复测量是在一段时间内或一个温度间隔内进行的,还可以研究因变量对时间、温度等自变量的变化趋势,这种重复测量研究称为趋势研究。 方差分析过程 1、 One-Way 过程:单因素简单方差分析过程。pare Means 菜单项中,可以进行单因素方差分析、均值多重比较和相对比较。 2、 General Linear Model( 简称 GLM) 过程: GLM 过程由 Analyze 菜单直接调用。这些过程可以完成简单的多因素方差
SPSS之——方差分析、回归分析、聚类分析 来自淘豆网m.daumloan.com转载请标明出处.