列联表的局部影响分析

来源 :云南大学 | 被引量 : 0次 | 上传用户:liuyan881119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离散型变量是随机变量中的一种重要的类型,在各个学科领域中存在大量的离散数据,因此离散数据中影响点和异常值的识别是一项重要的研究工作。影响分析作为研究数据集中影响点的一种技术,受到了广泛的重视。在以往文献中诊断影响点的方法主要可分为两种,一种是数据点删除法,另一种是局部影响方法。在局部影响方法中,Cook(1986)提出了基于似然距离的影响图的法曲率来度量扰动的影响,并用于识别数据中的影响点。由于该方法具有许多优点,获得了广泛的应用;Shi(1997)提出的广义影响函数及广义Cook统计量也为识别数据的联合影响提供了非常重要的研究工具。这两种局部影响的方法对线性回归模型中影响点的诊断已有了大量的文献。然而对离散数据局部影响分析的研究,目前相关文献较少。本文专门针对离散数据构建了一种局部影响分析方法,并把该方法用在了二维列联表的局部影响分析中,获得了一系列结果:同时通过实例分析验证了方法的有效性。本文的主要研究内容如下: 1、本文通过极小化power-divergence统计量为准则估计离散数据的模型参数,并建立以此进行局部影响分析的基本思想:Rao(1961,1962)介绍了二阶有效的思想,在这种情况下他证明了在极小化power-divergence估计中,λ=0时(MLE)的估计量是最优的。Berkson(1980)对Rao的准则提出质疑,Hodges and Lehmann在Berkson的基础上提出了估计量的deficiency,他们比较的是估计量的二阶近似均方误的差别。在这个准则下,MLE不一定是最优的。 2、基于power-divergence统计量构建出了Ⅰ距离函数及其影响图和保形法曲率,并证明了相应的性质。由于本文是用极小化power-divergence统计量估计离散数据的参数,构建的Ⅰ距离函数的一阶导数在ω。处的值为0,避免了用极大似然估计时一阶导数不为零时所带来的计算上的麻烦。Cook提出的法曲率可取任意值且在刻度的一个一致(uniform)转换下并不是不变的。因此没有客观的准则来评价该曲率的大小和与大的法曲率相对应的方向的相对大小。本文给出的保形法曲率有着良好的性质:对任意单位方向h,C<,I,h>满足不等式0≤C<,I,h>≤1;θ的再参数化的不变性;ω的保形再参数化的不变性。而且本文构造了一个客观标准来评价C<,I,h>的大小。 3、把Ⅰ距离函数及其保形法曲率用在了二维列联表的局部影响分析中,研究了二维列联表中在独立模型下,log模型下和logit模型下的局部影响分析,并用例子加以说明,得到了很好的结果,验证了该方法作为研究离散数据的局部影响分析方法的可行性。 本文首次构建了基于power-divergence统计量的Ⅰ距离函数及其影响图和保形法曲率,提出了专门诊断离散数据的影响点的局部影响方法,证明了相应的性质,并把该方法用到了二维列联表中,在三种模型下得到了很好的结果,用实例说明了该方法的可行性,充实了局部影响分析方法。
其他文献
该文应用线性θ-方法,单腿θ-方法和Runge-Kutta方法解带有延迟项[t],[t-1],[t+1]的延迟微分方程.主要研究这些方法的稳定性和收敛阶.应用线性θ-方法和单腿θ-方法解这些方
随着网络经济的繁荣,对于Linux桌面系统的研究也是如火如荼,Linux桌面系统以管理简单、安全可靠、高性价比的优势获得了越来越多用户的亲睐和支持。从2000年年底我国政府采购
数论主要研究整数的性质,是最重要的数学分支之一.它的一个重要的特点是:在其漫长的发展历史中,人们始终以一些著名问题为中心来探索各种可能的研究方法.本文主要研究了加拿大数
粗糙集理论是八十年代初由波兰数学家Z.Pawlak首先提出的一个分析数据的数学理论.该理论近年来日益受到各领域广泛关注,并已在机器学习、模式识别、决策分析、过程控制、数据
本文主要围绕两个问题展开研究:能源回购项目下的最优库存控制,有限信息的鲁棒定价。  世界经济的快速发展和工业化进程的推进促使各国电力需求激增,电力供需矛盾为能源回购
信息安全的一个重要工具是密码技术,而密钥则是密码技术的根基,本文主要讨论了内网中的对称密钥分发问题。文中引入了一种全新的密钥分发协议KDP(KeyDistributionProtocol),分析
在线学习能够有效处理实时数据流和大规模数据,是机器学习领域的一个研究热点。在线学习一般指模型或分类器根据实时获取的新样本和反馈信息不断地进行更新学习,从而使得模型的
本文对软件agent在供应链管理中的应用进行了研究。主要内容包括: 1.设计和实现了一个多agent系统ABEAI用于企业应用集成,具有较好的扩展性和适应性,有效的对企业遗留系统进
本文简要回顾了变论域自适应模糊控制器的基本思想和构造过程。在介绍倒车问题的背景后,根据实际情况设计了倒车问题的变论域自适应模糊控制器。紧接着在Matlab平台下进行了系
粗糙集理论是上世纪80年代初由波兰数学家Z.Pawlak首先提出的关于数据分析的数学理论.自上世纪90年代起,该理论日益受到到重视,并成为国际学术界的研究热点之一.  本文分别从