生存分析
在医学研究中有时候需要对病人的生存情况加以评价,例如:肺癌病人术后生存情况或者是两种不同方案对肺癌病人治疗后的比较。从理论上说,在完全收集到所有病人因肺癌死亡的确切时间后,可以用术后生存时间这个指标来描述病人的生存状况,并对不同的组别间加以比较。但在实际随访过程中,由于失访、意外死亡等原因,部分研究对象不能随访到确切的存活时间。所以,无法以生存时间直接进行统计分析,而需要采取一些特殊的统计方法,接下来将对此进行详细介绍。
基本概念
生存时间、截尾
:某医师从2002年1月1日起对6名肺癌患者进行跟踪观察,记录其结局,:
6例肺癌患者随访记录
研究号
(1)
姓名
(2)
术后开始随访时间
(3)
终止随访时间
(4)
结局
(5)
生存天数
(6)
1
赵××
00-01-16
00-09-01
失去联系
229+
2
钱××
00-01-26
01-03-18
局部复发死亡
417
3
孙××
00-02-05
01-12-25
车祸死亡
689+
4
李××
00-02-19
02-10-01
研究终止
955+
5
王××
00-03-07
00-11-11
局部复发死亡
249
6
刘××
00-03-20
02-01-24
远处转移死亡
675
生存时间(survival time)是指从某起点事件(start point event)开始到被观测对象出现终点事件(endpoint event)所经历的时间。如从疾病“确诊”到“死亡”;从“治疗结束”到“复发”;某电子设备从“开始使用”到“出现故障”,等。由此可见,此处的“生存”是一个广义的概念。根据研究目的不同,可以有不同的“起点时间”和“终点时间”。生存时间的单位可以用年,月,周,日,甚至时,分,秒等表示。上表中的(6)即为生存时间,有2种类型:
(1).plete data):是指被观测对象从观察起点至出现终点事件所经历的时间。,如果终点事件被设为死于肺癌,那么417、249、675为完全数据。
(2).截尾数据(censored data):是指在出现终点事件前,被观测对象的观测过程终止了。由于被观测对象所提供的信息是“不完全的”,只知道他们的生存时间超过了截尾时间。,229+、689+、955+为截尾数据。
起点事件(start point event):指研究者根据研究目的开始关心某一事件的起点,如上面所说的“确诊”、“治疗结束”、“开始使用”等等。
终点事件(endpoint event):指研究者根据研究目的所关心的某一事件,如上面所说的“死亡”、“复发”、“出现故障”等等。需要注意一点,不同的研究目的有不同的终点事件,如果研究的是肿瘤的局部复发情况,那么死于肿瘤远处转移只能算做截尾,而不是终点事件。
截尾(censor),又称终检、删失,主要有3种情况:①失访:指失去联系,如信访未回信,上门不见人,电话采访不答理或搬迁未留新地址等原因;②退出:指退出研究,如因其他非此次研究疾病死亡,临时改变治疗方案而中途退出研究;③终止:指研究时限已到而终止观察。
死亡概率、生存概率
死亡概率(mortality probability):记为q,是指在某段时间开始时存活的个体在该段时间内死亡的可能性大小。若无截尾数据,死亡概率的估计公式为:
()
生存概率(survival probability):记为p,是指在某段时间开始时存活的个体至该时间结束时仍存活的可能性大小。生存概率的公式为:
()
由于生存分析中常存在截尾值,假定失访等截尾事件在观察时段的各个时间点等机会发生的,故分母改用校正观察例数
生存率及标准误、生存曲线
生存率(survival rate):用S(tk)表示,是指病人经历tk个单位时间后仍存活的概率。若无截尾数据,则
()
其中t为病人的存活时间,但如果资料中含有截尾数据,分母必须按时段进行校正,此公式则不再适用,此时生存率的计算公式应为
()
其中、、…、表示不同时间段的生存概率,可以看出,生存率是多个时段生存概率的累积,故生存率又称为累积生存概率(cumulative probability of survival)。
生存率标准误的计算公式为
()
::
某恶性肿瘤100例术后随访资料
术后
年数
t~
(1)
期初观
察例数
n0
生存分析 来自淘豆网m.daumloan.com转载请标明出处.