论文部分内容阅读
随着社会和经济的快速发展,抽样调查在经济社会中的作用越来越大,但是各种影响调查准确性的因素也逐步出现,调查中出现缺失数据已经成为不可避免的现象。如果在调查的过程中出现数据缺失,而对缺失的数据有没有采取任何调整的话,那么在利用样本信息去推断总体信息时就会产生偏倚,统计分析的效率也会大大降低,严重时甚至会产生错误的结论。 基于这样的现象,已经有很多文献关注如何对无回答即缺失数据进行修补和调整。无回答类型分为单位无回答和项目无回答,这样分类的目的主要是处理的技术不同。对于单位无回答主要是利用加权方法,对于项目无回答主要是针对插补方法。当然也有一些方法对两类问题都可以使用,例如本文要研究的校准加权法。 校准加权方法(calibrated weighting method)是这样一种方法,它利用辅助信息对样本的初始权数进行权数调整,以达到改善估计量性质的目的。它的提出最初是为了解决样本结构与总体结构偏差性的问题。随着校准理论的不断完善和发展,它的应用领域也越来越广泛,其中一个应用就是处理无回答的问题。 本论文以无回答问题为主要背景,首先对利用加权方法改善无回答估计的传统方法作了系统介绍,随后提出利用校准加权方法来处理无回答问题,介绍了校准加权的基本思路、计算步骤和性质,进而通过与传统的加权方法做比较讨论了该方法的优缺点,然后从复杂方差估计的角度来研究校准加权法的方差估计以及评价了估计效率。最后利用实际案例数据对这一方法进行实证分析。 本论文可以得出以下几点主要结论: 1.同时存在项目无回答和单位无回答时,应该先进性项目无回答调整,再进行单位无回答调整;否则就会产生偏倚,低估总体总量的真实水平。 2.在处理无回答问题时,在初始权数上先要进行无回答概率的调整,然后再进行校准加权调整,同时利用样本中有回答的辅助信息调整回答单元集,这样会使估计的效率更高。 3.对于分层随机抽样的样本来说,可进行分别校准估计和联合校准估计。在本文的实证分析中,联合校准估计的结果更优良。 4.对校准加权估计量的方差的估计存在困难且不稳定。在现实中主要是利用复杂样本的再抽样方法,例如本例中使用Bootstrap法,在总体辅助信息已知时,重复抽样的次数越多,方差的标准差估计越小,且在1000次的时候趋于稳定。