Logistic回归分析
公共卫生学院
2003年
一、前言
应变量为分类指标的资料
线性回归分析:
应变量为连续计量资料
二、 Logistic回归模型
Logistic回归的分类
二分类
多分类
条件Logistic回归
非条件Logistic回归
Logit变换
也称对数单位转换
logit P=
流行病学概念:
设P表示暴露因素X时个体发病的概率,则发病的概率P与未发病的概率
1-P之比为优势(odds), logit P就是odds的对数。
Logistic回归模型
Logistic回归的logit模型
Logistic回归模型
三、参数估计
最大似然估计法
(Maximum likehood estimate)
似然函数:L=∏Pi
对数似然函数:
lnL=∑(ln P)=ln P1+ln P2+…+ln Pn
非线性迭代方法-
Newton-Raphson法
四、参数检验
似然比检验(likehood ratio test)
通过比较包含与不包含某一个或几个待检验观察因素的两个模型的对数似然函数变化来进行,其统计量为G (又称Deviance)。
G=-2(ln Lp-ln Lk)
样本量较大时, G近似服从自由度为待检验因素个数的2分布。
比分检验(score test)
以未包含某个或几个变量的模型为基础,保留模型中参数的估计值,并假设新增加的参数为零,计算似然函数的一价偏导数(又称有效比分)及信息距阵,两者相乘便得比分检验的统计量S 。样本量较大时, S近似服从自由度为待检验因素个数的2分布。
Wald检验( wald test)
即广义的t检验,统计量为u
u服从正态分布,即为标准正态离差。
Logistic回归系数的区间估计
Logistic回归分析 来自淘豆网m.daumloan.com转载请标明出处.