带缺失数据列联表与半参数非线性动态因子模型的统计推断

来源 :云南大学 | 被引量 : 0次 | 上传用户:liongliong536
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代科学技术的高速发展,出现了越来越多的各种分类数据,基于这类数据的统计推断是生物医学研究中的一个重要课题.其中存在一类特殊的带缺失数据的R×C列联表,特别是带缺失数据的2×2列联表引起了许多学者的关注.本文研究了这类数据的统计推断问题.半参数动态因子分析模型(NDFAMs)是一个使用十分广泛的统计模型.使用传统方法来对这种NDFAMs进行统计建模和统计推断是非常困难的,有时甚至也是不可能的.本文就NDFAMs的建模和贝叶斯推断也作了一些工作.全文主要内容如下:1.系统研究了带缺失数据列联表的等价性问题.在一些应用中,缺失数据机制依赖于分组而与治疗结果无关.基于这类缺失机制,我们研究了带不完全配对数据优比的等价性问题,提出了似然比统计量,score统计量和两个Wald型统计量,设计了三种检验方法(包括渐近方法,渐近无条件方法和Bootstrap重抽样方法).模拟研究表明渐近方法对于小样本或离散型样本导致第Ⅰ类错误暴涨,而渐近无条件方法和Bootstrap重抽样方法产生的第Ⅰ类错误更接近预先给定的显著性水平.和渐近方法相比,基于score检验统计量的Bootstrap重抽样方法和渐近无条件方法常常拥有:(i)第Ⅰ类错误更靠近名义显著性水平,(ii)在控制第Ⅰ类错误的前提下,拥有更高的功效,(iii)计算简单.因此,我们推荐在实际应用中采用基于score检验统计量的渐近无条件检验方法.2.基于贝叶斯统计推断思想,对第二章中的等价性评价问题在R×C情形下进行再研究.其解决方案是将它转换为一种分层模型,再利用Stan进行建模.通过Stan的抽样机,就可以得到参数估计(包括贝叶斯P值)和密度函数估计.这种方法的最大特点是对带不完全数据的列联表统计推断提供了一种通用性解决方案.基于Stan的列联表建模具有非常好的灵活性,只需要做很少的修改就可以适用于列联表的其他统计推断问题.3.研究了基于固定特异性水平下敏感差的区间估计问题.针对这个问题,基于广义分位数统计量,Wilson score统计量,Agresti-Coull统计量以及Bootstrap重抽样,我们提出了相应的五种区间估计方法,并在模拟研究中分别计算了这些方法相应的覆盖概率,区间长度和左右误差率.结果表明基于Agresti-Coull统计量的混合方法,无论样本容量是小或中等程度,还是误用相应分布.其效果都好于其他现存方法.当然,如果指定的分布恰当,那么基于广义分位数统计量的方法还是令人满意的.4.研究了一个半参数非线性动态因子分析模型(DFAMs)的贝叶斯统计推断.本章介绍了一种最新的建模设计语言RStan.借助于此工具,假定DFAM模型中的参数先验服从截断DP先验,给出了这种模型的RStan代码,并利用模拟样本数据进行了统计分析推断.模拟结果表明,这种方法无论是计算效率,还是推断精度都具有一定的优势;更为重要的是这种方法具有一般性,特别是针对分层模型的贝叶斯推断.综上所述,在对带缺失机制的分类数据进行统计推断时,既采用了频率学派的统计思想,也考虑了带先验分布的贝叶斯推断;尽管不同的思想都还有各自的优缺点,但是从方法的简洁有效性,准确性,可移植性等来看,我们还是更推崇贝叶斯方法,特别是随着分类数据维数的增加,计算难度和耗时显著增加.将这些数据结构转化为一个分层模型,不仅能降低分析的难度,而且更容易利用开发软件来建模.基于RStan语言来对分层模型进行统计推断不仅方便有效,而且具有一般框架性.
其他文献
本文主要研究几类对称图的弧传递循环和亚循环正则覆盖及其相关问题.刻画对称图的正则覆盖是代数图论的基本问题之一,它常常是刻画一般对称图的关键环节(正则覆盖的定义见第二章).经过众多学者的努力,已经建立了一套研究正则覆盖的电压图理论.这个理论对于确定小阶数对称图的循环和初等交换正则覆盖通常是有力的.利用这个理论,众多小阶数对称图的边传递或弧传递循环和初等交换正则覆盖被完全分类.此外,两类对称图类K。和
本文旨在建立应用变分方法研究时标上的共形分数阶微分方程边值问题的工作空间,并应用变分方法研究时标上的共形分数阶微分方程边值问题解的存在性和多解性.首先我们完善了时标上的共形分数阶微积分的一些性质.其次,我们在时标上的共形分数阶微积分理论的基础上建立了时标上的共形分数阶Sobolev空间,研究了该空间的完备性、自反性、一致凸性、嵌入定理以及其上满足一定形式的泛函的连续可微性等重要性质.最后,作为其在
在极端相对论重离子碰撞中,微扰量子色动力学(perturbative Quantum Chromodynamics, pQCD)预言在碰撞中心区域物质能量密度可以足够高而形成夸克物质解禁相。在高能重离子碰撞中,碰撞中心区域能物质量密度很高使得物质离开强子相进入夸克物质解禁相(Glasma和夸克-胶子等离子体),然后夸克物质继续膨胀冷却回到强子相。当物质处于Glasma和热夸克-胶子等离子体相时,夸
本文旨在使用变分方法研究带次临界增长、临界增长和超临界增长的一般拟线性薛定谔方程.在位势函数和非线性项满足适当的条件下,我们获得了其解的存在性、多重性和集中现象.首先,第一章简要介绍问题的背景,研究现状和本文结构.第二章,在周期位势情形下,我们使用Nehari流形方法研究了次临界问题基态解及无穷多对几何相异解的存在性,并且获得了其正解、负解、高能解序列的存在性结果.我们的结果分别推广了房祥东、Sz
球状星团主要是由大量的低金属丰度的年老恒星(特征年龄100亿年)组成的球状的自引力束缚系统。迄今为止,银河系内已经发现了158个球状星团。2008年之前人们对这类源只探测到光学和射电辐射。Fermi卫星成功发射后,球状星团的伽马射线辐射被成功探测,进而被确认为是一类新的伽马射线辐射源。由于大部分球状星团的纬度低,受银盘的弥漫背景伽马射线辐射的影响显著,因此认证困难。迄今为止,伽马射线球状星团的数目
本文讨论了重夸克偶素在极端相对论性p-p碰撞中的非弹性电磁产生过程,以及重夸克偶素在热介质中离解的热宽度机制。非弹性电磁过程是指入射质子与靶质子中的部分子经由交换虚光子发生反应的过程。本文发展了一套完整处理极端相对论性p-p碰撞中重夸克偶素的非弹性电磁产生过程的方法,这一方法的精确性和适用范围都优于传统的等效光子近似方法,并在在光子虚度Q2→0时可以给出等效光子近似的形式。为了避免重复计数的错误,
非编码RNA广泛存在于原核生物和各种真核生物中,在生物体的生长发育衰老疾病等生物学机制中都发挥重要的调控作用。MiRNA是非编码RNA中研究得最为清楚的一类small RN A,大小在21 nt左右,在动植物中的功能和调控机制都有比较系统的报道,并已应用到各物种的生物学功能机制研究和人类疾病治疗等方面。目前真菌中已经报道了microRNA-like RNA,但其生物学功能还不清楚。本文在捕食线虫真
嗜冷酶能够在低温条件下保持高催化活性,究竟是什么样的分子机制能够保证它们在低温条件下原子热运动降低的同时又具有较高的催化效率?嗜冷酶的这种特殊性质也是当今酶学和蛋白质工程领域的研究热点。本文利用高温分子动力学(molecular dynamics;MD)模拟以及 PT-WTE(parallel tempering in well-tempered ensemble)分子动力学模拟,对嗜冷丝氨酸蛋白
本文中,我们首先建立了时标上带脉冲和不带脉冲的动力方程解的三类比较定理,并在时标上引入了右稠分段连续概周期函数的定义:其次.我们提出了时标上脉冲动力方程的两个Lyapunov函数型定理:然后,作为这些理论的应用,我们分别研究了三类种群系统的动力学性质.通过利用时标上动力方程解的比较定理,概周期函数的壳理论和Lyapunov函数方法,我们得到了一些保证所研究的时滞多种群Lotka-Volterra共
本文提出了时标上加权伪概周期函数的定义,讨论了这一类函数的一些性质,从而得到了时标上动力方程的加权伪概周期解的存在性定理,作为应用本文讨论了时标上的神经网络(包含时标上的中立型神经网络)的加权伪概周期解的存在性与全局指数稳定性,发现若时标上的神经网络满足一定的条件,当外部输入函数分别是概周期函数,伪概周期函数以及加权伪概周期函数时,神经网络分别有一个唯一的概周期解,伪概周期解与加权伪概周期解,而且