Logistic Regression Analysis Logistic回归分析
童新元中国人民解放军总医院
2004年10月18日
Logistic回归分析
在医学研究中, 经常要分析某种结果的产生与哪些因素有关。例如:生存与死亡, 发病与未发病, 阴性与阳性等结果的产生可能与病人的年龄、性别、生活习惯、体质、遗传等许多因素有关。如何找出其中哪些因素对结果的产生有显著性影响呢? Logistic回归分析能较好地解决这类问题。
一、 Logistic回归模型
1、 Logistic回归模型的构造
若因变量y为连续型正态定量变量时, 可采用多元线性回归分析y与变量 X1, X2, …, Xp之间的关系: y=β0+β1X1+β2X2+…+βpXp
现y为发病或未发病,生存与死亡等定性分类变量,不能直接用上模型进行分析。
能否用发病的概率P来直接代替 y呢?
p=β0+β1X1+β2X2+…+βpXp
等式左边变化范围
P 发病概率 0≤ P≤1
1-P 不发病概率 0≤ P≤1
p/1-p 比数(ratio) 0 ≤ p/1-p<+∞
ln(p/1-p) 对数比(ratio) -∞< ln(p/1-p) <+∞
2、 Logistic 回归模型为:
ln[P/(1-P)]=β0+β1X1+…+βpXp.
定义:logit(P)= ln[P/(1-P)]为 Logistic变换, Logistic 回归模型为:
logit(P)=β0+β1X1+…+βpXp ;
经数学变换可得:
exp(β0+β1X1+…+βpXp)
P= ─────────────
1+ exp(β0+β1X1+…+βpXp);
exp表示指数函数。
Logistic回归模型是一种概率模型, 它是以疾病,死亡等结果发生的概率为因变量, 影响疾病发生的因素为自变量建立回归模型。它特别适用于因变量为二项, 多项分类的资料。
在临床医学中多用于鉴别诊断, 评价治疗措施的好坏及分析与疾病预后有关的因素等。
CHISS软件要求,对分类变量Y数量化,而且赋值为:
1 发病(阳性, 死亡, 治愈等)
y =
0未发病(阴性, 生存, 未治愈等).
注意:P=P(y=1), 即发病的概率。
3、软件的要求
4 、回归系数βi的意义
设只有一个自变量X,Logistic方程为
ln P/(1-P)= β 0 + β 1x
X= 0表示非暴露,1 表示暴露。
X=1时的发病概率为 P1;
X=0时的发病概率为 P0。
P1/(1-P1)
则, OR= ──────
P0/(1-P0)
Logistic回归分析 来自淘豆网m.daumloan.com转载请标明出处.