带测量误差的半参数以及结构非参数模型的统计推断

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:haisheng1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
回归分析是统计中应用最成熟和最广泛的分支之一。然而,有很长一段时间,关于回归分析的理论主要是关于参数回归的。传统参数回归方法有许多优点,其中最重要的是比其它方法更加精确和更加有效,且容易得到简洁的统计推断结果。但是,在很多实际复杂的情况中,通常的参数模型,尤其是线性模型的假设并不一定正确,当假定的参数模型错误时,会导致大的建模偏度,所获得的参数结果可能导致极大的估计偏差。也就是俗称的模型误判,模型误判将导致误导的统计结果。   为了放松传统参数模型的假定,以更好的探求数据可能的潜在结构,提出了从数据本身出发的非参数方法。纯粹非参数模型是一种较为稳健的统计建模方法,克服了参数模型的最大缺点--不稳健。进行非参数建模时可以做很少的模型假设甚至对模型不做任何假设,直接由数据出发。但是非参数统计推断方法也有一个致命的缺点:对于高维数据的处理,其效率是很低的或是无效的,所得的结果很不准确。其主要原因就是“维数祸根”所引起的。除此之外,非参数模型解释能力不强以及缺乏外推的能力,这些缺点都使得非参数方法的使用受到一定的局限。   而半参数与结构非参数方法结合了非参数及参数方法的优点,既降低了纯粹参数方法容易发生模型误判的风险,同时又克服了纯粹非参数方法“维数祸根”、不易解释和外推等缺点。因此,近来半参数与结构非参数回归受到了统计学家和实际应用者越来越多的重视。由于半参数与结构非参数方法在统计上具有兼顾抽样数据差异性、研究对象的个体差异性及群体差异性等特点,被广泛应用于生物学、经济学、医学、金融学以及人文社会科学等。   变系数模型、部分线性单指标模型以及半参数变系数部分线性模型作为结构非参数和半参数方法,被广泛应用在很多情况。比如多维非参数回归,广义线性模型,非线性时间序列模型,以及纵向数据、生存数据、金融和经济数据的分析中。但是关于这些模型的研究大多是关于数据为准确观测的情况。   我们知道,在许多实际应用领域,例如金融、经济、生物等领域经常会遇到数据不可被直接观测的情况,也就是说会遇到感兴趣的变量包含测量误差的情况。若只是简单的使用包含测量误差的数据进行估计,所得到的估计将不再是相合估计。   一般来讲测量误差的类型有两种。第一种类型是,所有研究个体真实的协变量数据均是不可得的,但是对于错误测量的变量可以实现重复测量。第二种测量误差数据类型是不能够测得所有感兴趣个体或一部分个体的协变量数据信息,且不存在重复测量,但是可以获得这些变量的相关辅助变量信息。   本文作者通过对国内外众多文献的研究发现,关于半参数以及结构非参数测量误差模型的研究主要是针对误差结构为第一类的情况,而关于误差结构为第二类情况下的半参数以及结构非参数模型的研究还很少。因此,对误差结构为第二类情况下的半参数以及结构非参数模型进行研究是本篇博士论文的主要内容。   此外,在实际研究中,通常会收集到很多的解释变量,而这些变量中的很大一部分有可能是不显著的,若是把不显著的解释变量包含到了模型中,会大大增加计算强度以及降低估计效率。因此,变元选择在统计分析中具有不可或缺的地位。近几十年来,变元选择的方法发展十分迅速,Akaike(1973)提出了AIC准则,Schwarz(1978)提出了BIC准则,George(1994)提出了RIC方法等,但这些方法由于存在缺乏稳定性以及不能将变元选择自身所固有的随机误差考虑进来等缺点。为此,Fan and Li(2001)提出了SCAD的方法,克服了以往变元选择方法不稳定的缺点。而Uike(2009)提出的光滑门限估计方程变元原则方法是另外一中具有很好性质的变元选择方法。其不仅保有SCAD方法的Oracle性质,而且具有在计算上更容易实现的优点。而已有变元选择方法的研究几乎都是在协变量是准确观测的情况,关于带测量误差模型的变元选择问题目前还很少有人研究。   因此,在测量误差情况下,对半参数及结构非参数模型进行显著变量选择研究是本篇博士论文的另一个主要内容。   本文对当协变量含有第二种类型测量误差情况下的变系数模型、半参数变系数部分线性模型以及部分线性单指标模型中未知非参数部分和参数部分的估计问题进行了一系列的研究,并进行了相关假设检验、置信带的构造以及变元选择的研究。除此之外,通过应用本文的估计方法对医学中的实际数据(杜兴肌营养不良症数据)以及金融数据(美国微软股票以及标准普尔指数数据)的分析,例证了本文所提出的方法不仅在理论上极具创新,而且也具有极强的应用性。   回顾整个研究过程,本文在理论上和方法上取得了多个创新成果。   第一,系统的研究了变系数模型中协变量含测量误差情况下未知变系数函数的估计问题。首先通过对误差协变量的刻画构造了未知函数的修正局部多项式估计,得到了相应估计的大样本性质,并用Wild-Bootstrap方法进行了相应的假设检验。   第二,针对修正局部多项式在对误差协变量进行非参数回归时需要的低平滑问题,本文接下来又研究了协变量含测量误差的变系数模型的两外两种估计方法,创造性地提出了:工具变量型局部多项式估计和基于误差协方差校正的局部多项式估计。并从理论上证明了这两种方法在成功的避免低平滑的同时,也使得到的估计达到了最优的非参数收敛速度。   第三,针对Zhou和Liang(2009)一文中所存在的两个不足:一是为了使参数部分和非参数部分的估计分别达到参数和非参数最优收敛速度,他们的方法需要低平滑测量误差协变量的回归刻画;二是没有涉及显著变元选择方面的研究。因此,本篇博士论文的第二大创新就是构造了参数部分协变量含测量误差的半参数变系数部分线性模型的工具变量型两步最小二乘估计。理论结果表明本文所提出的估计方法在不需要低平滑的条件下,分别得到了参数部分和非参数部分的相合估计,并达到了相应的参数和非参数最优收敛速度。此外,针对在测量误差情况下,关于显著变量选择方面的空白,本文将光滑门限估计方程的思想应用到半参数变系数部分线性测量误差模型,在对显著性的变量进行选择的同时,得到了显著变量系数的估计。并证明了相应估计的Oracle性质。   第四,本篇博士论文的第四个创新就是将一般估计方程的思想应用到部分线性单指标测量误差模型的估计问题中。在不需要得到讨厌非参数部分的相合估计的情况下,同样可以构造出参数协变量带第二类测量误差的部分线性单指标模型中参数部分的相合估计。并且在确保参数部分的估计达到√n收敛速度的同时,不需要对任何非参数部分的估计应用低平滑的技巧。此外,针对测量误差情况下,部分线性单指标模型变元选择方面内容的空缺,将光滑门限估计方程的思想扩展应用到部分线性单指标测量误差模型的变元选择问题研究,在对显著性变量进行选择的同时得到显著变量系数的估计。并且证明了相应估计的Oracle性质。   本文共包括七章。各章的主要内容如下。   第一章主要介绍本文的研究背景和研究内容概况,对国内外现有的有关测量误差模型的研究进行了综述性的介绍,针对测量误差研究方面存在的问题和空白,对本文的研究价值以及创新之处进行了客观和科学的阐述。   第二章主要讨论了当协变量含第二类测量误差情况下,变系数模型中未知变系数函数的估计和假设检验问题。提出了修正的局部多项式估计方法,证明了所提出估计的大样本性质,并且用Wild Bootstrap检验对模型的拟合优度进行了检验。而数值模拟结果进一步例证了本章所提出的估计及检验方法在小样本情况下的优良表现。   第三章的研究内容是针对第二章所提出的估计方法所存在的不足--为了使估计达到最优的非参数收敛速度,本章提出了估计协变量含测量误差的变系数模型中未知变系数函数的工具变量型局部多项式估计。理论结果表明本章提出的估计在达到非参数最优收敛速度的同时,成功地克服了低平滑的问题。   在第四章,本文针对协变量含第二类测量误差的变系数模型估计时需要克服的低平滑问题,提出了另外一种新的估计方法--基于误差协方差纠正的局部多项式估计方法。通过应用差分方法对测量误差的误差方差进行估计,而避免了对测量误差协变量的非参数刻画,从而达到了克服低平滑的目的。不仅证明了所提出估计的相合性,并且通过构造变系数函数的置信带对变系数函数进行了检验。   第五章本文对参数协变量带测量误差的半参数变系数部分线性模型中未知参数部分和非参数部分的估计问题进行了研究。针对Zhou和Liang(2009)一文中所提出的两步估计方法所存在的不足,即为了使参数和非参数部分的估计分别达到最优的参数和非参数收敛速度,本章将工具变量型估计的思想应用到了参数协变量带测量误差的半参数变系数部分线性模型的估计问题。结果表明,本章所提出的估计方法在确保参数和非参数部分的估计分别达到了最优的参数和非参数收敛速度的同时,成功地避免了低平滑的问题。此外,本章还用门限光滑的方法对该模型的变元选择进行了研究。   第六章对协变量包含测量误差情况下的部分线性单指标模型的估计问题进行了研究。构造了参数部分协变量带测量误差的部分线性单指标模型的一般估计方程估计,并证明了相应的估计能达到半参数有效界。除此之外,本章还对参数部分协变量带测量误差的部分线性单指标模型的显著变量选择问题进行了研究,用光滑门限估计方程对显著变量进行选择,同时也得到了显著变量系数的估计。理论以及数值模拟例子的结果进一步例证了本章所提出方法的优越性。   而第七章则对全文进行了总结和展望。
其他文献
自然资源的丰富程度是关系到经济增长的一个重要因素。理论上,该要素能在一定程度上扩大生产可能性边界,但在现实中却出现了相反的现象,即自然资源丰富的国家经济发展远不如资源
[关于8·14美加大停电事故调查综述]rn2003年8月14日发生了美加大停电事故,美加两国有关部门组织了事故调查组,到目前为止,调查组共发表三个调查报告:(1)2003年11月19日发表
4月9-10日,上海时装周期间由以纺织服装行业为主导的时尚创意产业园区--东方时尚中心携手多位著名时装设计师举行的2015上海时装周秋冬作品发布专场--“国际潮流设计师红毯秀
期刊
【摘 要】 新的《初中英语课程标准》明确指出了词汇教学在整个初中阶段的重要地位,并对初中学生的英语词汇学习提出了明确的要求。本文将以牛津译林版初中英语教材为例,探讨在初中英语词汇教学中如何运用有效的记忆策略来帮助学生进行词汇学习。  【关键词】 初中英语 词汇教学 记忆策略  对于初中英语教学而言,词汇教学的如何,直接影响着学生的英语基础以及学生对于英语学习的兴趣。然而,纵观我国目前的初中英
青少年是人们的新希望,也是社会可持续发展的主要力量。青少年体育事业的发展带给我国青少年更加健康的身心,随着经济社会和和体育事业的发展,青少年体育面临着新时代的诸多
高职高等数学是大学里各个专业的一门重要的基础课,如何为后续的专业课程打下一个良好的基础,主要是要做好数学课与专业课程内容上的衔接统一。 Higher mathematics in high
我们党在全国执政近60年的历程中,以毛泽东、邓小平、江泽民同志为核心的三代中央领导集体和以胡锦涛同志为总书记的党中央,在党风廉政建设方面不懈地进行理论和实践探索,保
本文首先介绍了校企合作的几种模式,并对在校企合作模式下高职电子类专业实践教学体系的构建提出自己的建议,期望可以推动校企合作模式深化和改革,提高高职学生的就业率。 T