回归分析
1页,共48页,星期三。
问题提出:
医学研究中常研究某因素存在条件下某结果是否发生?以及之间的关系如何?
因素(X) 疾病结果(Y β>1,OR>1 , 有关,危险因素
β<1,OR<1, 有关,保护因子
事件发生率很小,OR≈RR。
多元回归模型的的 概念
14页,共48页,星期三。
二、logistic回归模型的参数估计
1. 模型中的参数(βi)估计
通常用最大似然函数 (maximum likelihood estimate, MLE)估计β, 由统计软件包完成。(讲义259页)
,
,
15页,共48页,星期三。
2. 优势比(OR)及可信区间的估计
如X=1,0两分类,则OR的1-α可信区间估计公式
为回归系数的标准误
(公式16-10)
16页,共48页,星期三。
例:讲义表16-1资料
一个研究吸烟、饮酒与食道癌关系的病例-对照资料(886例),试作logistic回归分析。
变量的赋值
17页,共48页,星期三。
经logistic回归计算后得
b0 =-, b1 =, b2 =,
方程表达:
控制饮酒因素后,
18页,共48页,星期三。
OR的可信区间估计
吸烟与不吸烟患食管癌OR的95%可信区间:
饮酒与不饮酒OR的95%可信区间:
19页,共48页,星期三。
三、Logistic 回归模型的假设检验
:对建立的整个模型做检验。
说明自变量对Y的作用是否有统计意义。
检验方法(讲义260-261页)
1)似然比检验 (likelihood ratio test)
2)Wald检验
3)计分检验(score test)
20页,共48页,星期三。
例表16-1吸烟、饮酒与食管癌资料(SAS软件计算)
。
Testing Global Null Hypothesis: BETA=0
Test Chi-Square DF Pr
似然比 2 <.0001
计分检验 2 <.0001
Wald检验 2 <.0001
21页,共48页,星期三。
:
检验模型中某β是否对Y有作用。
检验假设:
检验统计量:主要为Wald检验(SAS软件)
例;
在大样本时,三方法结果一致。
公式16-13
ν=1的χ2
22页,共48页,星期三。
例表16-1资料,对各x的β做检验(wald检验)
参数 β估计值 标准误 Chi-Squa Pr
常数- .0001
吸烟 .0001
饮酒 .0008
Odds Ratio Estimates
Point 95% Wald
Effect Estimate Confidence Limits
吸烟x1
饮酒x2
23页,共48页,星期三。
似然比检验(讲义)
对某个β做检验,检验统计量(G)
包括p个自变量的对数似然函数
包括 l 个自变量的对数似然函数
G服从自由度(d)=p-l的χ2分布
24页,共48页,星期三。
似然比检验对β做检验
例:X1为吸烟,X2为饮酒,检验饮酒与食管癌关系,H0:β2=0,H1:β2≠0
G >,p<,说明调整吸烟因素后,饮酒与食管癌有关系。
25页,共48页,星期三。
四、变量筛选
目的;将回归系数有显著意义的自变量选入模型中,作用不显著的自变量则排除在外。
变量筛选算法有:前进法、后退法和
逐步法(stepwise)。
例:讲义例16-2,用逐步法
,
例:16-2讲义261-263页
26页,共48页,星期三。
表16-4 进入方程的自变量及参数估计
变量 β
回归分析详解 来自淘豆网m.daumloan.com转载请标明出处.