试验设计数据的方差分析和一般线性模型
吴喜之
1
试验设计
在几乎所有领域都有各种试验。比如
如何对不同的土壤、气候等各种条件找出最合适的作物,使得收益最大
如何使得工业产品优质、价廉
什么环境下,儿童才能在心理上健康成长
企业采取的什么主动措施能够增加收益
2
试验设计模型就是回归模型
在水产养殖业中,比如养蟹,因变量是产量,自变量是水温,饲料,疾病等。
描述试验设计的模型就是回归模型的一种
但试验设计问题本身有很大一部分是如何设计试验,使得人们有可能用最少的资源得到最好的结果。
当然,我们不打算详细讨论如何设计试验,而把主要精力放在试验设计数据的方差分析上。
3
方差分析
方差分析(analysis of variance,ANOVA)是分析各个自变量对因变量影响的一种方法。
这里的自变量就是定性变量的因子及可能出现的称为协变量(covariate)的定量变量。
分析结果是由一个方差分析表给出的。
4
方差分析分解因素贡献的机理
原理为:因变量的值随着自变量的不同取值而变化。我们把总变化(差的平方和)按照自变量(因素)进行分解,显示每一个自变量的贡献;最后剩下无法用已知的因素解释的则看成随机误差的贡献。
然后用各自变量的贡献和随机误差的贡献进行比较(F检验),以判断该自变量的不同水平是否对因变量的变化有显著贡献。输出就是F-值和检验的一些p-值。
下面看一个例子。
5
单因素方差分析回顾() 饲料比较数据, n=19头猪, 用p=4种饲料喂养一段时间后的重量增加问题: 四种饲料是否不同?
饲料
A
B
C
D
6
饲料例子(继续):饲料(fodder)为自变量(单因子),重量增加(weight) 为因变量(一个数量变量) (SPSS计算机数据形式有所不同)
饲料
A
B
C
D
均值A= 均值B= 均值C= 均值D=
7
四种饲料的箱图
四种饲料的均值图
8
假设:
检验: H0: m1=…=mp
线性模型:
9
公式:总平方和=组间平方和+组内平方和
其中, SST 有自由度 n-1, SSB有自由度 p-1, SSE 有自由度 n-p,在正态分布的假设下, 如果各组增重均值相等(零假设), 则
有自由度为 p-1 和n-p 的F 分布.
10
方差分析方差分析 来自淘豆网m.daumloan.com转载请标明出处.