因此,关于年龄的比例假设的零假设似乎是成立的。SAS Program ,这里并没有给出,他们都揭示了比例风险。
毫不奇怪,关于风险率的这三个协变量的估计回归系数是统计显著的,,这和先前的结果是一致。从用柯尔莫哥洛夫模型对这三个协方差进行的上限测试的结果来看,每个比例风险假设都得到了遵从,。显然,从该方法得到的结果与加入了时间相关分量的方法得到的那些结果相矛盾。
检查协变量的函数形式
,我介绍了几个精制的图形和数值方法来检查模型中的比例风险假设。研究者们也关心协变量的函数形式,正如在文献上广泛讨论的回归模型,一个连续变量可以
采取许多函数形式比如。在特定的情形中,可以被分成两个或多个亚组,以此来得到某种联系之间的非线性关系。在生存分析里,误用协变量的函数形式可能会导致模型参数的失真,因此会得到误导性或者错误的结果。
在这一部分里,我将介绍两种统计方法来检测一个协方差的函数形式,这种检验方法比较模型对不同连接函数的拟合,以特定的协方差、图形和数值形式的方法,并使用基于鞅残差的累计总和。一个例子,是检查美国老人死亡率的模型中的年龄的函数形式。
从统计的角度来看,这种方法简单直接,并且与线性或非线性回归的方法一致。假设我们想检验协方差的函数形式。首先,模型中的协方差向量x可以被分成两个部分,要评估的协方差和中其他协方差的向量。假定存在比例风险,并令的真正的函数形式用来表达,则正确的模型应该是:
其中β1是的回归系数。在大多数情况下,是对其初始形式或者其以均值为基础的形式(就是
减去的均值)的简单近似,同时假定该变量与对数风险线性相关。如果有明显的证据表明这种线性假设不成立,那么寻找一种的合适的函数形式就十分必要。
实际上,我们可以用n种不同的的连接函数创造出n种回归模型,来检查哪种函数形式对对数风险的拟合度最高。假设与其他协方差是独立的;的一个合适的函数形式可以通过比较对种模型的统计测试的的结果来确定。在诸多的的函数形式中,在估计回归协方差方面,在测试中得分最高的回归局势最合适模型。因此,那个特定的的函数形式被认为是最真实的的形式。
或者,可以通过使用部分似然比率测试来进行对的函数形式的统计测试。特别的,对两个满足两个不同的的函数形式的模型,分别定义为和,则部分似然比率测试得分是:
其中分别是从f(γ-1)和f(γ)的函数形式的模型转换而来的Xm的估计回归系数,并且是部分似然比率测试统计量,反映了的函数形式是否和的函数形式一样得到统计信息,有着相同自由度的分布。,第一项是对函数形式的模型的对数偏似然比率统计量,相应的,第二项是对的。如果
<,f(γ)的格式不会提高模型的拟合程度,因此表明f(γ)应该从进一步的比较中应该被筛选掉,应该保留。如果>,则f(γ)比更好的预测了统计上的风险比率;因此这种函数形式应该保留下来做进一步的比较,相应的f就要被筛选掉。最终的最合适的函数形式可以从个按复杂度排序的备选项中选择出来。
有时候,仅通过上述的方法来判断某种协方差的特定函数的可靠性在技术上存在难度。例如,不是这几种常用的函数形式(比如),一些高阶多项式也经常使用。给出的线性的、二次的、并且高阶项之间的相关性的问题,以为中心是必要的以减少多重相关性,由此使选择一个合适的函数形式复杂化了。和其他协变量之间的相关性也必须加以考虑,从而选择过程显著复杂化。具体来说,复杂的相互关系的协变量之间存在可以使测试结果值得怀疑。也许是由于这些原因,一些统计人员推荐计算和标绘鞅残差找到一个函数形式是最接近(Klein和Moeschberger,2003; Therneau,Grambsch和弗莱明,1990)。如果与的积鞅作为协变量线性相关,则不需要中的转化;如果积鞅出现非线性,则的变换可能是必要的。在重截尾的存在,但是,很少见到积鞅残留或其变换的被线性分布,。
用基于鞅的残差的累和检查函数形式
。如果仅仅通过检查鞅残差和转换,则很难得到关于比例风险的有效性令人信服的结论。一样的问题存在用于检查协变量的函数形式,林,魏,和Ying(1993)通过检查与一个已知分布在两个随机过程,由方程()和()表示,提供一个较为客观的方法。以检查协变量的形式,他们提出画出鞅残差的局部总和过程,写成:
其中是的的一个特例,,其中,并且。
如上所述,的零分布可以通过模拟相应的零均值高斯过程来实现。在
专业外语 来自淘豆网m.daumloan.com转载请标明出处.