论文部分内容阅读
生存分析是研究特定事件发生时间的一门学科,在生物医学及工业领域等都有广泛的应用。其主要的内容就是对时间的生存函数,风险函数与其影响因素即协变量之间的关系进行研究。由于生存函数与风险函数之间一一对应,而风险函数又易于建模,所以,生存分析主要的问题就转移到对风险函数的研究上。对于风险函数的建模,主要有比例风险模型和加性风险率模型,其中应用最广泛的Cox模型是比例风险模型中最为著名的半参数模型。目前对于简单数据下的风险函数的研究,已经日臻完善。但是,在实际应用中,由于试验设计、个体的特殊原因以及观测时间的局限等原因,所获得的数据会有协变量缺失的情形。比如,在研究影响癌症的因素时,由于一些被调查者的中途退出或者不服从安排,导致一些协变量无法测量到。这就给风险函数的统计推断问题带来了一定难度,因而历年来对缺失协变量的研究已经成为生存分析中比较热门的一个课题。本文主要在以下两方面作了研究:
1.对于协变量随机缺失下的加性风险率模型,提出了一个再加权方法来估计加性风险率模型中的回归系数和基本风险率函数,同时证明所获得的估计是相合的并且是渐近正态的。数值模拟显示了再加权估计的优良的性质,并且在估计协变量的系数方面,提出的方法在选择概率比较小的时候要比简单加权估计有效。另外,提供了一个小老鼠白血病的实例来验证我们的方法。
2.对上面提出的再加权估计方法进行改进,采用非参数核平滑估计的方法来估计观测概率和缺失协变量的条件期望,然后通过把非参数估计的权重和条件期望带入简单再加权估计和完全扩展的再加权估计模型中,获得了感兴趣的参数和基本风险率函数的估计,同时证明所获得的估计是相合的并且是渐近正态的。数值模拟显示了非参数权重的再加权估计的优良性质,并且在估计协变量的系数方面,提出的方法在选择概率比较小的时候要比简单加权估计有效,而且要比参数的再加权估计和简单加权估计更稳健。另外,提供了一个小老鼠白血病的实例来验证我们的方法。