第一节 方差分析概述
在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。通常是比较不同实验条件下总体均值间的差异
举例
医学界研究几种药物对某种疾病的疗效;
农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响
不同饲料对牲畜体重增长的效果等
不同广告形式、地区规模等因素对广告效果的影响等
都可以使用方差分析方法去解决
方差分析是检验多个总体均值是否相等的一种方法。本质上是研究分类型自变量对数值型因变量的影响。
方差分析概念
控制因素(控制变量):在方差分析中,所要检验的对象称为因素。其常为一个或多个离散型的分类变量。
水平:因素的不同类别或不同取值为因素的不同水平。因素的每一个水平可以看作一个整体。
观测因素(观测变量):在进行方差分析时,每个控制因素水平下得到的样本数据。
几个基本概念
方差分析中判断总体均值是否相等一般是通过对数据变异来源的分析判断得到。
变异来源有两种情况:控制因素和随机因素。
控制因素:控制变量不同而造成的变异。
随机误差:在同一因素下的观察值由于抽样的随机性造成的误差(抽样误差)。
方差分析基本原理
数据变异用离均差平方和表示。
组内误差(随机误差)
数据误差 随机误差
组间误差 系统误差
衡量同一水平下样本数据的误差
衡量控制变量不同造成的变差
方差分析的核心是方差可分解。这里的方差是指通过计算各观测值偏离均值的平方和再除以n-1得到。这样,在给定n的情况下,方差就是离差平方和,简称SST。
观察量的总平方和(SST)分解为组间离差平方和(SSA)和组内误差平方和(SSE),即:
SST=SSA+SSE
由误差来源的分析得知,判断分类型自变量对数值型因变量受否有影响,就是检验数值型变量存在差异的原因。如果这种差异主要是系统误差,则分类型变量对该数值存在显著影响,否则差异不显著。
根据统计学原理,组间均方和组内均方的比值构成F分布。给定显著性水平,通过和F分布统计量的概率P的比较,推出总体均值是否存在显著差异。
方差分析一般应满足3个基本假设,即要求:
各个总体应服从正态分布
各个总体的方差相同
观测值是独立的。
第二节 单因素方差分析
单因素方差分析的基本思想
单因素方差分析的数学模型
单因素方差分析的基本步骤
单因素方差分析的基本操作
单因素方差分析的应用举例
单因素方差分析的进一步分析及应用
单因素方差分析的基本思想
单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响。
例如:学历是对工资收入的影响。
概念
明确观测变量和控制变量
;控制变量是学历
剖析观测变量的方差
比较观测变量总离差平方和各部分的比例
如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由控制变量引起的,否则,则不是。
基本思想
SPSS统计分析方法及应用方差分析 来自淘豆网m.daumloan.com转载请标明出处.