论文部分内容阅读
高维数据的统计分析研究是当前国际统计学领域研究的前沿热点方向.高维回归模型是高维数据统计分析的重要工具,它具有易于解释,计算速度快等诸多优点,本文主要对高维回归模型的统计推断问题进行研究,其中包括参数检验和参数估计两个方面,并将其应用在生物医学领域中解决实际问题.本文的主要工作如下: 提出了一种高效的线性模型参数检验方法,在高维情形下,传统方法比如F-检验和t-检验并不适用,我们提出的Jackknife经验似然统计量在原假设下渐近收敛于卡方分布,且其收敛条件要弱于现有的方法.模拟结果表明我们的方法可以很好地控制第一类错误,且在大多数情形下比现有方法更有效,另外我们使用此方法研究六号染色体上的单核苷酸多态性和关节炎发病之间的关系. 提出了一种基于经验似然方法的广义线性模型参数检验方法.我们分别考虑了整体参数检验和局部参数检验问题,提出相应的经验似然统计量,并证明了该统计量在原假设下均可渐近收敛到卡方分布,和目前其它广义线性模型参数检验方法相比,我们的方法计算速度更快,在备择假设条件下功效更高.实际关节炎发病数据的分析也更进一步凸显该方法的实用性和高效性. 提出了一种基于相对误差标准的高维参数估计方法.该方法被应用到高维失效加速时间模型参数估计问题中,可以作为惩罚最小二乘方法和惩罚最小绝对偏差法的替代,我们使用Kaplan-Meier权重来处理右删失,并使用惩罚函数来处理高维情形.我们还提出了一种结合Majorize-Minimization和逐坐标下降的算法来优化目标函数,我们使用此方法来研究基因表达和肺癌预后数据之间的关系. 提出了一种关于多响应变量高维线性模型的稳健参数估计方法.该方法中我们使用密度功效散度损失函数来处理厚尾分布和数据污染问题,并结合惩罚函数方法来处理高维问题.我们基于逐坐标下降法来优化目标函数.模拟结果显示,该方法效果要好于惩罚最小二乘方法和惩罚最小绝对偏差方法,我们还使用此方法来研究基因表达和拷贝数变化之间的调控关系.