一、对数线性模型简介1、对数线性模型基本思想对数线性模型分析是把列联表资料的网格频数的对数表示为各变量及其交互效应的线性模型,然后运用类似方差分析的基本思想,以及逻辑变换来检验各变量及其交互效应的作用大小区别方法列联表逻辑回归对数线性模型作用分析定类变量和定类变量之间有无关系分析尺度变量(也可引入类别变量)与二分类别变量之间的因果关系综合运用方差分析和逻辑回归中的建模方法,应用于纯粹定类变量之间,系统评价各变量间关系和交互作用大小的多元统计方法优缺点不需要确定因变量和自变量。但是,卡方检验对三维和三维以上列联表资料的分析有一定困难,即对混杂变量的控制较难解决了对混杂变量的控制的问题,而且,它能将因变量与自变量的关系用模型表示出来,清晰易理解。但是,当模型中自变量较多,特别是名义变量较多,或名义变量的类别较多时,分析自变量之间的交互效应就很繁杂,可能需要建立很多哑变量可以直接分析各种类型的分类变量,对于名义变量,也不需要事先建立哑变量,可以直接分析变量的主效应和交互效应。对数线性模型不仅可以解决卡方分析中常遇到的高维列联表的“压缩”问题,又可以解决logistic回归分析中多个自变量的交互效应问题2、列联表的四种类型双向无序列联表;单向有序列联表;双向有序且属性不同的列联表;双向有序且属性相同的列联表4、列联表的劣势:对于多关系变量(两个以上)研究:不能被清晰解读失去了对多变量之间的交互联系的分析进行两变量间关联分析时缺乏统计控制不能准确定量描述一个变量对另一个变量的作用幅度5、对数线性模型:多维度列联表解决之道,以及模型自身特点通过数学方法(方差分析+逻辑变换)来描述多元频数分布。综合性:同时囊括多个变量于一个模型之中。控制性:可以在控制其他变量的条件下研究两个分类变量之间的关联。饱和性:将多元频数分布分解成具体的各项主效应和各项交互效应,以及高阶效应,不会漏项。(饱和模型与不饱和模型)定量性:以发生比的形式来表示自变量的类型不同反映在因变量频数分布上的差异。可检验性:不仅可以对所有参数估计进行检验,使抽样数据可以推论总体,且能够通过不同模型的统计检验结果,对备选模型进行筛选和评价,进而确定具有最大解释能力且最简单的模型。消除抽样波动所带来的明显的不规则性6、对数线性模型的缺点对数线性模型更强调的是变量之间的交互效应,它不能直接将因变量用自变量的函数表示出来。对数线性模型抽象复杂,特别是高维模型,不如线性回归模型易理解二、对数线性模型的基本原理1、与方差分析相关的在多元方差分析中,以二元方差为例:每一个观测值yij=µ+Ai的效果+Bj的效果+(AB)ij交互作用+Ɛij2、比数比比数比是对数线性模型的基础,而比数比又是由比数计算而来。那么什么叫做比数呢?比数是一个事件发生的概率与其不发生概率之比,测量了一个事件发生的可能性。这个数值越高说明结果2相对于结果1发生的可能性就越高。Fij代表某模型fij的期望值,令πij代表与单元格(i,j)有关的期望概率上表可转化为
对数线性模型教育课件 来自淘豆网m.daumloan.com转载请标明出处.