高维回归模型的若干统计推断问题研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:gaiwenru
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高维数据的统计分析研究是当前国际统计学领域研究的前沿热点方向.高维回归模型是高维数据统计分析的重要工具,它具有易于解释,计算速度快等诸多优点,本文主要对高维回归模型的统计推断问题进行研究,其中包括参数检验和参数估计两个方面,并将其应用在生物医学领域中解决实际问题.本文的主要工作如下:  提出了一种高效的线性模型参数检验方法,在高维情形下,传统方法比如F-检验和t-检验并不适用,我们提出的Jackknife经验似然统计量在原假设下渐近收敛于卡方分布,且其收敛条件要弱于现有的方法.模拟结果表明我们的方法可以很好地控制第一类错误,且在大多数情形下比现有方法更有效,另外我们使用此方法研究六号染色体上的单核苷酸多态性和关节炎发病之间的关系.  提出了一种基于经验似然方法的广义线性模型参数检验方法.我们分别考虑了整体参数检验和局部参数检验问题,提出相应的经验似然统计量,并证明了该统计量在原假设下均可渐近收敛到卡方分布,和目前其它广义线性模型参数检验方法相比,我们的方法计算速度更快,在备择假设条件下功效更高.实际关节炎发病数据的分析也更进一步凸显该方法的实用性和高效性.  提出了一种基于相对误差标准的高维参数估计方法.该方法被应用到高维失效加速时间模型参数估计问题中,可以作为惩罚最小二乘方法和惩罚最小绝对偏差法的替代,我们使用Kaplan-Meier权重来处理右删失,并使用惩罚函数来处理高维情形.我们还提出了一种结合Majorize-Minimization和逐坐标下降的算法来优化目标函数,我们使用此方法来研究基因表达和肺癌预后数据之间的关系.  提出了一种关于多响应变量高维线性模型的稳健参数估计方法.该方法中我们使用密度功效散度损失函数来处理厚尾分布和数据污染问题,并结合惩罚函数方法来处理高维问题.我们基于逐坐标下降法来优化目标函数.模拟结果显示,该方法效果要好于惩罚最小二乘方法和惩罚最小绝对偏差方法,我们还使用此方法来研究基因表达和拷贝数变化之间的调控关系.
其他文献
成败型不完全数据模型,这是在贮存寿命研究中经常遇到的问题:产品贮存t时间后,对产品检查,只知道这产品是好的还是已不能使用,而不知保持产品良好状态能贮存多长时间(贮存寿
进行向量小波变换首先要解决的问题就是预滤波,而这也是目前制约向量小波应用的一关键所在.深入透彻的研究这一问题,有着重要的理论和应用价值.该文就是以此为出发点展开研究
该文研究不确定需求条件下,单层、多项目、有能力约束的生产计划系统中,冻结主生产计划(MPS)对系统性能的影响,重点分析预测误差和预测模型与环境因素和冻结参数之 间的交互
梯度投影法是求解线性约束最优化问题的有效方法,但此算法不能保持矩阵的稀疏性,因而很维用于求解大规模稀疏性线性约束优化问题.该文提出了一个新的有效集算法,所提方法运用
该文在Sederberg T.W.和汪国瑾的Bezier曲线隐式化证明的基础上,给出了乘积型Bezier曲面和三角Bezier曲面的隐式化证明.这种证明方法对于由基变换和结式理论给出的隐式方程,
该文在模拟人类思维模式和知识库修正领域中进行了一些探讨.主要做了以下两方面工作.第一章,研究人员在开放逻辑的知识库理论中引入序的概念.根据已给定的序给出了一些满足特
经过一个可靠性增长试验,如何对产品最后阶段可靠度的置信下限进行估计,是该文所关心的问题.该文的基本假设是:(1)每个阶段产品的寿命服从指数分布;(2)每个阶段采取定总时有
辐射热传导计算是辐射流体力学数值模拟的重要组成部分,广泛应用于天体物理、惯性约束聚变等诸多领域。过去由于受计算机条件的限制,且高维辐射热传导问题的计算量较大,所以整体
本文主要研究Riemann面上带有cusp奇点与锥奇点的共形度量。  首先,本文定义了三种强度的cusp奇点和锥奇点并介绍其相关性质。进一步给出了共形度量在满足面积和Calabi能量