论文部分内容阅读
无回答现象在调查中越来越普遍,已经成为影响调查结果重要的因素之一。加权调整方法简便易行,并且在加权辅助变量选取合适时,能够很好地降低无回答误差,因此在无回答问题的处理中得到了广泛的应用。加权调整方法在何时能有效地降低目标变量估计的偏差?对目标变量估计值的方差产生了何种影响?如今学界对这些疑问还没有定论。本文采用计算机模拟研究的方法对这些疑问进行探讨。
文章共分五章:第一章为导论,主要介绍选题背景和意义,相关文献研究结果,研究思路以及主要创新点。第二章为无回答加权相关理论介绍,包括无回答机制,降低无回答影响的主要加权调整方法,无回答影响的度量指标,以及无回答加权后的影响分析。第三章为单变量加权模拟研究,首先在无混杂回答机制下,按照无回答率(高、中、低),样本量(大样本、小样本),加权辅助变量和目标变量的相关性(高、中、低),加权辅助变量和回答概率的相关性(高、中、低)分为54种情况。对这54种情况分别进行单变量加权计算机模拟,比较在不同情况中无回答加权的效果。然后讨论混杂回答机制对单变量加权调整效果的影响。第四章为多变量加权模拟研究,在单变量加权模拟研究的基础上,增加一个加权辅助变量,对比增加新变量前后无回答加权的效果。第五章为结论、建议和不足,根据模拟研究得出的主要结论、对现实无回答处理的建议,以及本文不足之处和继续研究的方向。
本文得出的主要结论有:
(1)在无混杂缺失机制下,当加权辅助变量和目标变量以及回答概率都相关时,对无回答进行加权调整可以同时降低目标变量估计的偏差和RMSE。当加权辅助变量和目标变量相关,和回答概率不相关时,对无回答进行加权调整可以降低目标变量估计的RMSE,但不能降低目标变量估计的偏差。当加权辅助变量和回答概率的相关,和目标变量不相关时,对无回答进行加权调整不仅不能降低目标变量估计的偏差上,反而会提高目标变量估计的RMSE。当加权辅助变量和目标变量、回答概率都不相关时,加权调整没有效果。
(2)在加权辅助变量和目标变量以及回答概率的相关性大于或等于0.5的情况下,缺失率较低时,对小样本进行加权对目标变量的改进程度大于对大样本进行加权时对目标变量的改进程度。而随着缺失率的升高,大样本量下加权对目标变量的改进程度逐渐提高。在缺失率为70%时,对小样本进行加权后,目标变量估计偏差和RMSE减小的比例和和对大样本进行加权后减小的比例是近似的。
(3)在混杂回答机制下,虽然加权机制更加复杂,但是在所进行模拟研究的这些情况,即加权辅助变量和目标变量以及回答概率变量的相关性均大于0.5时,加权调整就可以同时降低对目标变量估计的偏差和RMSE。
(4)非混杂回答机制下,进行两辅助变量加权,主加权辅助变量和回答概率以及目标变量相关,次要加权辅助变量只和回答概率相关。那么在主加权辅助变量和目标变量以及回答概率相关系数均为0.8,次要辅助变量和回答概率的相关系数比0.3要大;采用两个加权辅助变量进行模拟研究要比只采取主要加权辅助变量进行单变量加权的加权效果好。主加权辅助变量和目标变量的相关系数为0.8,主加权辅助变量和回答概率的相关系数为0.5,次要辅助变量和回答概率的相关系数大于或等于0.5时,采用两个加权辅助变量进行模拟研究要比只采取主要加权辅助变量进行单变量加权的加权效果好。