不完全数据下的分位数回归模型的统计分析

来源 :中国科学院数学与系统科学研究院 | 被引量 : 0次 | 上传用户:carjitar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分位数回归模型相比普通回归模型能够更加全面的描述所研究的统计对象。在越来越多的研究当中,我们通常希望知道研究对象在不同水平时受各种变量因素的影响,而不仅仅局限于平均水平。分位数回归模型正好能满足这种需要。它能够全面地反映出数据的内在关系和局部特性。因此,它在经济,金融,保险,医学研究等许多领域得到了广泛的应用。   然而,由于保存方式,度量工具和一些人为因素的影响,我们所得到数据经常受到污染,从而导致不完全数据。比如缺失数据,删失数据和有度量误差的数据等。对于少量的不完全数据,通常可以直接删除或者丢弃,不会对分析结果产生较大影响。但是如果不完全数据较多,或是整个样本数据不大,就很有可能对统计结果带来很大偏差,有些时候甚至得到完全相反的结果。另外,由于分位数回归模型本身的特性,现有处理不完全数据的方法不能直接套用。因此,本文就关于这个问题进行了比较深入的研究,提出了两种处理该问题方法,从理论上证明和讨论了相关估计的渐近性质。最后通过数据模拟进行比较,得出相关结论。   本文首先研究了响应变量缺失情况下样本分位数回归模型的参数估计问题。我们构造了样本分位回归模型的估计方程,并且通过指示变量对该估计方程进行改写,得到缺失数据下的样本分位回归模型的估计方程。对于估计方程的含有缺失数据部分,我们采用了两种方法对其进行填补。一种方法是采用Zhou,Wan and Wang(2008)提出的非参核方法对缺失部分的条件期望进行整体插补,保证了估计方程的渐近无偏性。另一种方法是借鉴了Aerts etal.(2001)提出的局部多重插补的思想,将ψ(Yi,θ)作为整体进行多重抽样,将抽样数据填补到缺失部分,这样同样保证了估计方程的渐近无偏性。我们证明了两种方法的分位数估计都具有渐近无偏性和渐近正态性。此外,我们还讨论了渐近方差估计和窗宽的选择。从理论上看,Zhou,Wan and Wang(2008)提出的非参核方法要好于后者,估计量的渐近方差要小。   本文然后分析了如何将整体非参核插补法和局部多重插补法推广到缺失数据下的线性分位数回归模型。由于线性分位回归模型和样本分位回归模型有很大的差别,这里我们不对估计方程的缺失部分进行插补,而是对回归函数p(Y,β)的缺失部分进行插补。这样对估计渐近无偏性和渐近正态性的证明就之前不同。这里我们采用了与Koenker(2005)相类似的方法。从证明结果上看,Zhou,Wan and Wang(2008)提出的非参核方法仍然好于局部多重插补法。   本文接着研究了含有缺失数据的部分线性模型分位数回归。通过两步法首先对部分线性模型中非参数部分进行估计:然后以此估计替换非参数部分,这样就转换成了线性模型,然后应用整体非参核插补法对β进行估计。本文证明了此估计具有相合性和渐近正态性。   最后针对文中提出的两种处理缺失数据的方法进行数值模拟,并根据模拟结果,给出了一些结论和建议。
其他文献
这篇博士论文主要研究一些Schrodinger算子的谱问题。本文主要研究了三个问题。   在第二章中,主要研究N体的Schrodinger算子。首先考虑唯一两簇的N体Schrodinger算子的稳
本文探究了量子反馈控制的基本特点。反馈是控制理论中核心的概念。经典控制论中对反馈控制已经有了很好的研究,但是目前对量子反馈控制的研究仍处于探索阶段,有许多根本性问题
原由德州机床厂和我所共同设计、试制的径向精密锻轴机经过不断地改进,现在已在济南汽车制造厂正常使用。这是毛泽东思想的伟大胜利,是毛主席的无产阶级革命路线的伟大胜利
本文考虑R3中粘性不可压缩Navier-Stokes方程(公式略),其中u:R3 X[0,T]→R3和P:R3×[0,T]→R依次表示流体的速度场和压力函数;u0(x)是给定的初始速度场。本文研究该方程弱解的正则性
本文定义了带位势H的F-调和映照、(F,H)-能量密度、(F,H)-应力能量张量,并用该(F,H)-应力能量张量和F-应力能量张量得到带位势H的F-调和映照的单调性定理以及消灭定理,在证明单调性定
自1990年贝纳德(H.Benard)首次在试验中观察到两平行导热板之间的流体由于温度梯度和引力场的共同作用,通过自组织形成空间有序斑图开始,斑图花纹的形成便一直是研究的热点。用
本文主要研究了复动力系统中的两个问题:奇异扰动有理函数中淹没Sier-pinski曲线Julia集的存在性问题和Baker问题,内容安排如下:   第一章是准备知识,介绍复动力系统的基本知
本文主要研究分数阶微分方程两点边值问题解的存在唯一性,构造不同的数值方法进行数值求解并给出误差分析。   本文主要结果如下:   (1)给出了两点边值问题解存在且唯一
本文研究二阶拟线性双曲型方程组的精确边界能控性与能观性.作者利用延拓的方法将已有的一维拟线性波动方程的局部精确边界能控性发展到了整体精确边界能控性.以一维拟线性波
这篇博士学位论文主要讨论了无穷曲面散射问题以及非齐次传导介质电磁散射反问题,全文共分为两大部分。   第一部分,讨论了无穷曲面散射问题无穷曲面散射问题描述的是声波、