论文部分内容阅读
由于统计学发展以及与其它交叉学科的实际应用不断深入,并随着科学技术的进步,生物医学,经济学,社会学,教育心理学等领域中不断出现了各种复杂的不完全数据,包括左截断数据,右截断数据,左删失数据,右删失数据,双边截断数据,双边删失数据,区间删失数据,缺失数据,长度偏差数据等等.不完全数据不同于简单数据,不仅存在数据观察的不完全性而且结构也更加复杂。对于不完全数据,简单数据原有的统计理论与方法不再适用,这促使统计学发展出新的统计模型,以及新的统计理论与方法,方能更好地刻画和分析这些复杂的不完全数据.复杂的不完全数据已得到国内外许多统计学者不断深入地研究,是当前统计学研究的国际前沿和研究热点之一. 单调转移模型是统计学和经济计量学重要研究议题之一,并且单调转移模型具有广泛应用背景.单调转移模型包含转移部分和参数及非参数部分,其中在此模型中通常考虑的转移函数具有单调性,但其一般是未知函数,因此是一类半参数模型.此模型在处理复杂数据,特别是在仅关心某些风险因子贡献率或不关心转移函数时,单调转移模型发挥重要作用.单调转移模型通常包括许多重要的统计模型,例如,线性模型,Box-Cox转移模型,二元选择模型,比例比率模型,Cox比例风险模型,加速失效时间模型等等. 单调风险转移模型是一类与单调转移模型平行,且研究对象不同的一类单调模型,其针对于风险率函数而不直接对响应变量进行建模,故称单调风险转移模型.单调风险转移模型比Cox比例风险模型,混合比例风险模型,可加风险模型更广泛的模型.此模型具有单调转移模型相关的性质和特点,但由于单调风险转移模型建模思想和统计推断方法常常不同.因此对其需要对其分开研究. 首先,本文的第二章研究了长度偏差右删失数据下单调转移模型的单调秩估计及应用.单调转移模型的转移函数和随机误差项的分布均是未知的函数,因此所讨论的模型具有适用范围广,建模灵活性强等特点,但是由于模型假设过于宽泛,这给统计推断带来困难.长度偏差右删失数据存在信息删失,以及长度偏差抽样数据改变原有数据结构等原因也给统计建模及推断造成困难.考虑长度偏数据的特点,基于经典单调转移模型单调秩估计的思想,第二章构造了适用长度偏差右删失数据下单调转移模型的秩估计,并证明了该估计收敛速度是√n,且满足渐近正态性.利用U-统计量的重抽样方法,本章提出一类新的渐近协方差矩阵的算法.此方法无需数值导数的计算,避免了光滑参数的选择.为了研究所提出估计的有限样本性质,进行了数值模拟试验,模拟结果显示所提出的估计是合理且渐近无偏,并且在奥斯卡数据上验证了该估计的可行性,获得有趣的结果.另外,第二章考虑了异方差删失下单调转移模型的回归参数识别性.双边随机删失数据下,该模型的参数识别性更难.异方差删失和双边随机删失数据情形下,本章提出条件矩不等式,证明了条件矩不等式的解与单调转移模型回归参数的一致性. 其次,本文第三章研究了单调风险转移模型及其参数的统计推断.基于单调风险转移模型的特征,对感兴趣的回归参数提出了回归参数光滑化单调秩估计和光滑化最大秩相关估计两种估计方法.在一些正则条件下,证明了这两种估计都是相合估计,并证明了这两种估计的收敛速度均是√n,且满足渐近正态性.此外,第三章同时研究了左截断数据下单调风险转移模型,给出了左截断数据下单调风险转移模型的光滑化单调秩估计,并证明了该估计满足√n相合和渐近正态.另外,在有限样本下进行蒙特卡洛模拟试验,模拟结果显示本章所提出的三种光滑秩估计的有限样本性质表现良好,说明了这三种光滑秩估计的渐近无偏性和合理性.同时,第三章证明了光滑秩估计的渐近方差与非光滑方法的渐近方差是一致的,即光滑化估计并未损失效率;渐近方差的计算可通过重抽样方法求得. 最后,本文第四章提出一类广泛的均值剩余寿命转移模型,假设基础均值剩余寿命函数和连接函数均是未知的函数.这个模型比现有的剩余寿命均值模型更加一般和宽泛,在建模上更加灵活和稳健.本章所提出的均值剩余寿命转移模型并不能包含在单调转移模型中,因为均值剩余寿命转移模型是一类动态模型,而且此模型包含了比例均值剩余寿命模型.另外,所提出模型克服了目前研究剩余寿命均值模型中要求连接函数(或称转移函数)二阶可导,且假设连接函数为已知的不足.一个有趣的发现是,利用单调转移模型的秩估计思想可以应用于发展本章所提出模型的回归参数估计.在双边随机删失数据下,第四章提出了均值剩余寿命转移模型回归参数光滑的最大秩估计,并在一些正则条件下证明了该估计满足√n相合性和渐近正态性.为了验证该目标函数的合理性,利用蒙特卡洛数值模拟进行分析,检验了有限样本性质,模拟结果说明所提出的方法是一种合理和可行的估计方法.本章所处理的数据是双边随机删失数据,我们首次在双边随机删失数据下建立均值剩余寿命转移模型,并相应地进行统计推断.