论文部分内容阅读
在抽样调查的过程中,通常会要求被访问者提供其相应的背景信息,如年龄、家庭月均收入、受教育程度等。背景因数不同的人往往会对社会、事物等产生不同的认识。这在抽样调查中体现为不同背景的被访问者对核心问题回答的差异颇大。
本文首先通过定性分析背景因数与核心问题回答之间的关系,结果显示部分背景因数与核心问题的回答之间存在明显相关关系,即背景因数对核心问题的回答有影响。由于一般情况下,总体中个体的背景因素差异非常大,若抽样比例较小,则会导致样本的结构与总体的结构不一致,样本缺乏代表性。所以在使用抽样调查数据之前,必须剔除背景因素的影响。目前国内抽样调查机构在使用抽样数据时,尚未对这种背景因数的影响引起充分重视,几乎没有相应的处理方法。而剔除背景因素影响的前提即是确定哪些背景因素对核心问题的回答有影响,以何种方式来影响,其大小如何。
由于通常情况下,考虑到问卷回答的简便性,同时为了便于统计调查结果,在设计问卷时,问卷设计人员通常会采用封闭式问卷的形式,由这种问卷得到的结果,被统称为定序变量(ordinaldata)。在定性分析背景因素对核心问题回答影响的基础上,本文结合广义线性模型中几种常用的处理定序变量的方法,例如比例差异比模型(proportionaloddsmodel)等,以消费者信心指数调查的样本数据为例,量化分析背景因素对核心问题回答的影响,并给出对于具体的某一个核心问题,背景因素对其回答影响的模型。结果显示,就该消费者信心调查来说,受教育程度和家庭月平均收入对大多数核心问题的回答有影响。受教育程度越高、家庭平均收入越高,其选择更低类别答案的比例就越大,消费者信心越高。
在确定出对核心问题回答有影响的背景因素之后,应用HorvitzThompson(HT)统计量对抽样调查的数据作适当调整,由HorvitzThompson统计量的性质,经过处理后的样本结构比较接近总体结构,由该统计量推断出的总体参数的精度比不考虑背景因素影响条件下的精度更优。