方差分析入门
单因素方差分析
均数两两比较的方法
小结
内容提要
前面提到的有关统计推断的方法,如单样本、两样本t检验等,其所涉及的对象千变万化,但归根结底都可以视为两组间的比较,如果是有一组的总体均数已知,则为单样本t检验,如果两组都只有样本信息,则为两样本t检验。但是如果遇到以下情形,该如何处理?
方差分析入门
案例 对于大学新生的入学成绩,可以通过t检验来考察男女学生间的入学成绩是否有差异?但要是想知道来自于江苏、浙江、上海、安徽等省份的学生,其入学成绩是否有差异,那么是否可以用6次t 检验来达成目的?
方差分析入门
在以上例子中,涉及的问题其实就是在单一处理因素之下,多个不同水平(多组)之间的连续性观察值的比较,目的是通过对多个样本的研究,来推断这些样本是否来自于同一个总体。
那么能否使用两两t 检验,例如做三组比较,则分别进行三次t检验来解决此问题呢?这样做在统计上是不妥的。因为统计学的结论都是概率性的,存在犯错误的可能。
方差分析入门
分析:用6次t 检验来考察4个省份的大学生新生入学成绩是否相同,对于某一次比较,其犯I类错误的概率为,那么连续进行6次比较,其犯I类错误的概率是多少呢?不是 6,而是1-(1- )6。也就是说,,那么连续进行6次t 检验,!这是一个令人震惊的数字!
结论:多个均数比较不宜采用t 检验作两两比较;而应该采用方差分析!
方差分析入门
提出的方差分析的理论基础:
将总变异分解为由研究因素所造成的部分和由抽样误差所造成的部分,通过比较来自于不同部分的变异,借助F分布作出统计推断。后人又将线性模型的思想引入方差分析,为这一方法提供了近乎无穷的发展空间。
方差分析入门
总变异 = 随机变异 + 处理因素导致的变异
总变异 = 组内变异 + 组间变异
SS总 = SS组内 + SS组间
这样,我们就可以采用一定的方法来比较组内变异和组间变异的大小,如果后者远远大于前者,则说明处理因素的确存在,如果两者相差无几,则说明该影响不存在,以上即方差分析的基本思想。
方差分析入门
方差分析的原假设和备择假设为:
H0:1=2=…=k
H1:k个总体均数不同或者不全相同
方差分析入门
独立性(independence)
观察对象是所研究因素的各个水平下的独立随机抽样
正态性(normality)
每个水平下的应变量应当服从正态分布
方差齐性(homoscedascity)
各水平下的总体具有相同的方差。但实际上,只要最大/最小
方差小于3,分析结果都是稳定的
应用条件
有时原始资料不满足方差分析的要求,除了求助于非参数检验方法外,也可以考虑变量变换。常用的变量变换方法有:
对数转换:用于服从对数正态分布的资料等;
平方根转换:可用于服从Possion分布的资料等;
平方根反正弦转换:可用于原始资料为率,且取值广泛的资料;
其它:平方变换、倒数变换等。
应用条件
单因素方差分析非参数检验用 来自淘豆网m.daumloan.com转载请标明出处.