论文部分内容阅读
竞争风险数据在很多生物医学的应用中频繁出现,很多学者对类型有限的竞争风险数据做了大量的研究。然而,在很多对生存数据的研究中,数据本身包含连续型的失效原因(标记)。例如,在HIV疫苗效力试验中,标记变量为在某种度量下疫苗中的HIV序列和被感染个体的HIV序列之间的基因距离。由于几乎对于所有的被感染的个体,标记都是独一无二的,我们很自然的认为标记变量应该是连续型的。针对这些带有连续标记的生存数据,我们需要有很好的统计模型和方法。在本文中,我们主要针对带有连续标记的生存数据进行了一系列的研究。 在第二章中,我们关于风险函数提出了一种带有连续标记的加性风险模型,利用广义估计方程和局部常数的方法,对回归参数进行推断,并证明了所得估计量的渐近性质。进一步,为了探究HIV疫苗是否存在效力以及疫苗效力随着标记的变化情况,我们做了一些与疫苗效力相关的假设检验,同时还建立了与疫苗效力相关的一些变量的置信区间、置信带。最后,通过数值模拟,我们展示和评估了所提方法在有限样本下的表现,并将所提出的方法应用于一组北美和荷兰地区的HIV疫苗效力试验数据。 由于在很多实际问题中,一部分协变量具有乘性效应而另一部分协变量具有加性效应,因此,在第三章中,为了提高模型在实际应用中的能力,我们关于风险函数提出了一个带有连续标记的可加可乘模型。我们利用广义估计方程和局部常数方法,对回归参数进行了推断,并证明了所得到估计的渐近性质。进一步,为了检验HIV疫苗是否存在效力,我们做了一些与疫苗效力相关的假设检验。最后,通过数值模拟,我们评估了所提出方法的有限样本性质。 由于以往的研究仅仅能够测试疫苗是否对至少一种HIV病毒存在抑制作用。然而,一个有效的疫苗应该对大部分侵染菌存在抗性。为了解决这个问题,在第四章中,我们提出一个变量选择的方法去检验疫苗是否对大部分的HIV病毒存在抑制作用。在这一章中,为了简化推导,我们关于风险函数同样用带有连续标记的加性风险模型进行建模,并提出了通过惩罚估计函数的方法同时进行变量选择和回归系数的估计,并证明了通过选择合适的惩罚函数和调谐参数,我们的估计不仅是√nh-相合的,而且具有Oracle性质。基于shooting算法以及BIC-型选择准则,我们提出了一种算法来实现我们所提出的方法。 模拟研究表明所提出的方法在变量选择和方差估计方面都表现良好,并将所提出的方法应用于一组北美和荷兰地区的HIV疫苗效力试验数据。