05列联表对数线性模型
THE GRADUATION POWERPOINT TEMPLATE
2021
答辩:
导师:T
二维列联表的检验
对于上面那样的二维表。我们检验的零假设和备选假设为
H0:观点和收入这两个变量不相关因为一个变量的各个水平的影响是相对的,因此,只有事先固定一个参数值(比如a1=0),或者设定类似于Sai=0这样的约束,才可能估计出各个的值。没有约束,则这些参数是估计不出来的。
(多项分布)对数线性模型
二维列联表的更完全的对数线性模型为
这里的(ab)ij代表第一个变量的第i个水平和第二个变量的第j个水平对ln(mij)的共同影响(交叉效应)。即当单独作用时,每个变量的一个水平对ln(mij)的影响只有ai(或bj)大,但如果这两个变量一同影响就不仅是ai+bj,而且还多出一项。
这里的交叉项的诸参数的大小也是相对的,也需要约束条件来得到其“估计”;涉及的变量和水平越多,约束也越多。
注意,无论你对模型假定了多少种效应,并不见得都有意义;有些可能是多余的。本来没有交叉影响,但如果写入,也没有关系,在分析过程中一般可以知道哪些影响是显著的,而那些是不显著的。
两种对数线性模型
前面介绍的多项分布对数线性模型假定所有的可能格子里面的频数满足多项分布。
(后面再介绍).
统计软件的选项中有关于分布的选项
高维表的检验统计量和二维表一样也包含了Pearson c2统计量和似然比c2统计量。
假定(多项分布)对数线性模型为
这里ai为收入(i=1,2,3代表收入的低、中、高三个水平),bj为观点(j=1,2代表不赞成和赞成两个水平),gk为性别(k=1,2代表女性和男性两个水平), mijk代表三维列联表对于三个变量的第ijk水平组合的出现次数。
而从相应的参数估计输出结果,, ,,对bj的两个值的估计为-,,对gk的两个值的估计为 ,。(多项对数线性模型常数无意义,输出的常数项仅仅是数学意义)
SPSS输出
就这里的三维列联表问题,如只考虑各个变量单独的影响,而不考虑变量组合的综合影响,其SPSS输出的Pearson c2统计量和似然比c2统计量得到的p-。
SPSS输出
SPSS的实现
[] 假定已经加权 (加权一次并存盘了既可)
这时的选项为Analyze-Loglinear-General,
首先选择格子中频数的分布,这里是多项分布 (其默认值是Poisson对数线性模型).
然后把三个变量(sex,opinion,income)选入Factors(因子);
再选Model(模型),如果选Saturated(饱和模型),那就是所有交叉效应都要放入模型;但如果不想这样,可以选Custom(自定义),在Building Terms(构造模型的项)选Main effect(主效应),再把三个变量一个一个地选进来(如果两个或三个一同选入,等于选入交叉效应).
如果想要知道模型参数,在Options中选择Estimates。
最后Continue-OK即可得出结果.
在计算机输出的结果中可以找到我们感兴趣的结果。
如果SPSS的Viewer输出不完全,可以选中不完全的输出,利用Edit-Copy Objects来复制到例如记事本那样的文件中,就可以看到完整输出了
Poison对数线性模型
有的时候,类似的高维表并不一定满足多项分布对数线性模型。下面看一个例子。这是关于哮喘病人个数和空气污染程度,年龄和性别的数据()
后面表格为某地在一段时间记录的60组在不同空气污染状态的不同年龄及不同性别的人的发生哮喘的人数。
其中性别为定性变量S(sex, 1代表女性,2代表男性),
空气污染程度P也是定性变量(polut, 1、2、3分别代表轻度、中度和严重污染),
年龄A (age)为定量变量,为那一组人的平均年龄;
还有一列计数C (count)为这一组的哮喘人数。
这个表格和前面的列联表的不同点在于每一格的计数并不简单是前面三个变量的组合的数目(某个年龄段,某种性别及某种污染下的人数),而是代表了某个年龄段,某种性别及某种污染下发生哮喘的人数。
Poisson对数线性模型简介在某些固定的条件下, 人们认为某些事件出现的次数服从Poisson分布, 比如在某一个时间段内
05列联表对数线性模型 来自淘豆网m.daumloan.com转载请标明出处.