【摘 要】
:
在大数据背景下,能够较容易获取到更多可利用的辅助信息,这有助于提高抽样估计精度。为了在抽样估计环节利用辅助信息,传统的做法是建立起研究变量和辅助变量之间的超总体回归模型,以此来调整和改进基于设计的随机化估计结果,这种方法被称为模型辅助抽样估计方法。其中,建立的回归模型是否恰当,以及对模型的估计是否合理,将是决定模型辅助抽样估计方法能否使估计精度提高或精度能提高多少的关键所在。现有研究已通过设置不同
论文部分内容阅读
在大数据背景下,能够较容易获取到更多可利用的辅助信息,这有助于提高抽样估计精度。为了在抽样估计环节利用辅助信息,传统的做法是建立起研究变量和辅助变量之间的超总体回归模型,以此来调整和改进基于设计的随机化估计结果,这种方法被称为模型辅助抽样估计方法。其中,建立的回归模型是否恰当,以及对模型的估计是否合理,将是决定模型辅助抽样估计方法能否使估计精度提高或精度能提高多少的关键所在。现有研究已通过设置不同模型形式来更好地拟合研究变量和辅助变量的关系,但忽略了建模过程中辅助变量的选择问题,通常依赖人为经验或传统模型选择方法选取单一模型进行辅助抽样估计。显然这种做法存在模型不确定性风险,同时也将删失部分有用信息,模型的辅助作用可能大打折扣,这将导致抽样估计精度改进不大,甚至没有改进。对于这类问题,一个可行的思路就是组合多个较优模型进行辅助抽样估计。为此,本文将模型平均方法引入到模型辅助抽样估计的框架中,通过设置合理的模型权重来组合多个模型进行辅助估计,不仅规避了单一模型选择偏差,也能够最大程度地利用有效辅助信息,以期稳健且有效地提高抽样估计效率。具体而言,本文主要包括以下几个方面的内容:第一,针对单一模型辅助抽样估计存在的问题,通过引入模型平均方法构建模型平均辅助抽样估计量。首先,本文在常见的线性超总体模型下,结合线性模型平均方法,根据广义差分估计思想提出了线性模型平均辅助抽样估计量,并从理论上证明该估计量是渐近设计无偏和设计一致的。其次,通过数值模拟验证了线性模型平均辅助抽样估计优于单一模型辅助抽样估计,尤其存在干扰信息时,其估计优势更加明显。最后,采用实际数据进行抽样估计的结果同样验证了本文所提估计量能够较好解决超总体模型建模中的不确定性问题,同时也有效地改进了抽样估计效果。第二,针对辅助变量维度较高的情形,提出了贝叶斯模型平均辅助抽样估计量。通过采用贝叶斯模型平均方法对线性超总体模型进行估计,结合广义差分估计法构建了贝叶斯模型平均辅助抽样估计量,并对其统计性质进行了证明。进一步的数值模拟分析结果表明,贝叶斯模型平均辅助抽样估计相比于单一模型辅助抽样估计,具有明显估计优势且符合渐近理论。最后的实际数据验证结果再次证实了这一结论。第三,针对变量选择和模型形式设置两类模型不确定性并存的情形,构建了部分线性模型平均辅助抽样估计量。首先,提出了对部分线性模型进行模型平均的思路,并给出了部分线性模型平均方法。其次,利用部分线性模型平均对超总体模型进行估计,并在广义差分估计的框架下,给出了部分线性模型平均辅助抽样估计量及其渐近性质。最后,分别就非参数结构确定和不确定两种情形进行了模拟分析和实际数据验证,结果显示无论是否固定非参数变量,部分线性模型平均辅助抽样估计都优于单一模型辅助抽样估计,其中当总体函数为非线性时,前者优势更加突出。第四,为将社交网络辅助信息应用于抽样估计,构建了网络模型平均辅助抽样估计量。首先,设置超总体回归模型为网络模型,并给出两类网络模型平均方法,同样在广义差分估计的框架下,提出了网络模型平均辅助抽样估计量。其次,在不同网络构成及不同网络目标函数下进行模拟分析,结果表明,网络模型平均辅助抽样估计优于未考虑社交网络信息的模型辅助抽样估计,也优于选择单一网络模型的辅助估计。最后,实际数据分析也验证了这一结论。第五,讨论了模型平均辅助抽样估计方法在我国的具体应用路径。首先,在回顾我国统计调查体系发展历程的基础上,指出影响抽样估计质量和制约抽样估计进一步发展的现存问题,并提出模型平均辅助抽样估计方法的一般应用思路。其次,就实施模型平均辅助抽样估计方案存在的突出问题,提出了针对性的工作举措。最后,通盘考虑各类情形下模型平均辅助抽样估计的具体实施,并结合小微企业抽样估计的现实情境,较为详细地给出了模型平均辅助抽样估计方法的实践指引。总体而言,本文引入了模型平均方法到模型辅助抽样估计的框架中,将传统的单一模型辅助抽样估计拓展至组合模型辅助抽样估计,不仅能够有效且稳健地改进估计精度,也推进了抽样估计方法与大数据的融合发展,对构建符合新时代要求的高质量统计调查体系具有重要参考意义。
其他文献
分布式文件系统为大文件存取提供了高效的解决方案,随着移动互联网和大数据的高速发展,分布式文件系统在用于海量小文件存取时出现了低吞吐、高时延等问题。为了提高小文件存取性能,设计新的方法应用于分布式文件系统具有重要意义。本文以小文件批量存取具有属性关联的特征出发,对小文件存取过程及负载均衡算法进行了研究,提出了面向小文件存取的MAB(Merge-Asynchronous-Batch)方法和基于剩余性能
Butelase-1是来源于蝶豆的一种天冬酰胺内肽酶类多肽连接酶,具有识别序列简单、催化效率高等优点,已被应用于多肽或蛋白质的环化或连接以及细菌的标记等多个方面。为了提高大肠杆菌重组表达Butelase-1的活性和生物量,本文运用多种生物技术手段改造表达质粒并筛选表达菌株,显著提高了重组Butelase-1酶原激活后的酶活;并将Butelase-1应用于食源性抗癌多肽Lunasin的首尾“无痕”环
为满足用户的多样化需求,第五代(5G)移动通信系统需要与2G/3G/4G系统并存。为了更好的网络覆盖和网络质量,对具有紧凑尺寸、多频带和高端口隔离度的双极化基站天线提出了更高的要求。在5G sub-6GHz基站系统中,不同频段间具有高选择性的多频天线已成为复杂电磁环境中日益迫切的需求,同时在更小口径下覆盖两个甚至更多频段也是研究关注的重点。本文针对相关双频共口径滤波天线单元及阵列进行深入研究,具体
社会的进步、经济的发展以及高等教育的深化改革,都对大学校园规划和建筑设计提出了更高的要求,以复合化的角度探索大学校园规划和建筑设计越来越受到人们的关注。教学是大学作为高等教育机构的根本职能,教学建筑在大学校园中有着重要的地位,然而当前大学公共教学楼建筑的设计仍存在一些问题。文章依托时代发展背景,针对大学公共教学楼的发展现状和问题,在研究建筑功能、空间的基础上,将文化的概念引入公共教学楼的设计之中,
我国城市化进程发展迅速,人地矛盾凸显,高密度、紧凑型的城市发展模式已经成为我国城市化进程的必然趋势。高密度城市环境也成为了建筑研究与实践中难以回避的现实条件与预设状态。同时,我国高等教育不断蓬勃发展,已步入普及化阶段。高校教育建筑作为高等教育的容器也呈现出多元化、开放化、集约化的发展趋势。一方面,在知识经济时代背景下,高校与城市双向赋能、双向服务成为了二者共同的需求,体现为高校因城市而兴,城市因高
老年艺术教育是实现“积极老龄化”的重要举措之一,也是老年社会工作的重要内容。老年人在参加艺术活动的过程中,能够愉悦身心,拓展社会交往网络,丰富业余生活,较好地满足其精神文化需求。但是,反观我国老年艺术教育的现实,仍采用传统艺术培训的教育理念、教育内容上缺乏创新、教学环境较差、社会化功能较弱。因此导致老年艺术教育虽然作为老年社会工作的重要内容,却没有充分发挥社会工作的功能,教育成效也与老年社会工作视
光子晶体是由不同折射率的材料在空间上按一定周期排列而成的人工微结构,而拓扑学是研究几何图形或结构在连续变形后还能保持不变的全局性质的学科。近年来,拓扑学概念被延伸至光子晶体领域,使人们发现了具有单向传输特性的拓扑光子态。这些拓扑光子态在传输过程中免疫于缺陷、障碍物和无序,这些特性归结于拓扑光子晶体中的缺陷、阻隔和无序只会引起局部性质变化而不影响全局性质。磁光光子晶体是最早实现拓扑光子态的人工微结构
在5G(第五代)移动通信网络不断深化应用的今天,2G/3G/4G系统也仍然在网应用。网络覆盖的天线的站址数量在系统的持续扩容中急剧增加,站址资源日趋枯竭。将2G/3G/4G/5G多系统多频段天线阵列合并为一副天线,最大化地减少天线的物理数量,是缓解上述站址困境的有效手段。基于这一背景,本文选择多频多系统混合基站天线作为研究方向,以突破2G/3G/4G/5G天线口径共用的实际应用难题为目标,为多系统
随着当前移动通信领域的快速发展,5G毫米波技术凭借丰富的频谱资源成为了未来通信系统的核心发展方向。GaN器件作为第三代半导体的代表,有着优秀的频率特性、高的击穿电压和高电子饱和速率。同时单片微波集成电路(MMIC)也成为小型化、高集成度设计的最佳选择。因此,GaN MMIC电路能够5G毫米波射频前端芯片的高性能需求。基于当前国内外形势与5G通信竞争环境,研究面向5G毫米波通信的GaN MMIC射频
员工创意是企业保持创新活力和获得长期竞争优势的源泉,新颖性作为创意最关键的要素,刻画的是与现有产品和市场相比,想法的新奇性、稀有性和独创性水平,凸显想法的潜在价值和创造性。鉴于新颖性想法对激发企业活力和提升竞争力的重要战略意义,越来越多企业采取多种方式积极引导和推动员工创意的产生,如谷歌提供员工“20%创新时间”,催生了Ad Sense、Gmail、谷歌新闻和GTalk等独创性产品;3M公司制定1