Logistic回归分析
对数优势线性回归
概述
当因变量为二值变量时,可用Logistic 回归分析探讨影响某现象发生的概率(P)的一组因素(xi)及其数量关系
P=1 : 死亡(发病,阳性,治愈)
P=0 : 生存(未发病,阴性,未治愈)
βX= β1 x1+β2x2+…+βpxp
(1)
则(2)
记logit(P)=ln[P/(1-P)](即P的logit变换)
则logit(P)= β0 +βX
=β0+ β1 x1+β2x2+…+βpxp (3)
X可任意取值,而P必然在0—1之间(图)
P/(1-P)为事件的优势,logit(p)为对数优势
Logistic 回归中β0 +βX与P值的关系
暴露组的死亡优势为
非暴露组的死亡优势为
暴露否
死亡
生存
合计
是(x=1)
a
b
m1
否(x=0)
c
d
m2
优势比(比值比):暴露组死亡优势与非暴露组死亡优势之比
所以βi就是在其他协变量不变时,xi每增加一个单位的暴露剂量所引起的死亡优势比的对数改变量,或单位暴露剂量与零剂量死亡优势比的对数;eβi就是两剂量的死亡优势比OR
βi为正时,exp( β i)大于1,x是危险因素,βi为负时,exp( β i)小于1,x是保护因素,
β 0是所有协变量x都等于0时死亡优势的对数,或eβ0是非暴露人群中的死亡优势
β 0= ln[P x=0/(1-P x=0)]
exp(β 0)= P x=0/(1-P x=0)
Logistic回归的两种类型
非条件Logistic回归:研究设计为成组病例对照研究、无分层的队列研究
logit(P)=β0+ β1 x1+β2x2+…+βpxp
条件Logistic回归:研究设计为配对病例对照研究或精细分层设计的队列研究
logit(P)= β1 x1+β2x2+…+βpxp
例:在研究医院抢救急性心肌梗死(AMI)病人能否成功的危险因素调查中,某医院收集5年中该院所有AMI病人的抢救病史共200例,P=0表示抢救成功,P=1为死亡,X1=1表示抢救前发生休克,X1=0未发生,X2=1表示抢救前发生心力衰竭,X2=0未发生,X3=1表示开始AMI症状到抢救时已经超过12小时,X3=0未超过12小时。
AMI抢救危险因素资料
P=0
P=1
X1
X2
X3
N
X1
X2
X3
N
0
0
0
35
0
0
0
4
0
0
1
34
0
0
1
10
0
1
0
17
0
1
0
4
0
1
1
19
0
1
1
15
1
0
0
17
1
0
0
6
1
0
1
6
1
0
1
9
1
1
0
6
1
1
0
6
1
1
1
6
1
1
1
6
Logistic 来自淘豆网m.daumloan.com转载请标明出处.