论文部分内容阅读
过去十年全基因组关联性研究发现了一系列与人类复杂疾病相关的常见遗传变异位点。然而,对许多复杂疾病而言,已发现的常见关联位点仅能解释极少一部分遗传度。越来越多的科学证据表明罕见变异是遗传缺失的重要原因之一,与常见变异一样在复杂疾病的发生发展过程中起着十分重要的作用。然而,罕见变异的关联性分析面临巨大挑战。本研究分为五个部分: 第一章从测序数据特点出发,介绍罕见变异关联性分析基于集合的思维。在此基础上,建立评价罕见变异关联性分析方法应该具备若干性质的标准。最后对现有方法(如负荷检验、SKAT、SKAT-O、MiST和GenRF)进行评价。 第二章通过似然比方差成分检验方法来研究罕见变异与连续型表型的关联性。假设罕见变异具有随机效应,检验一组罕见变异是否同时与表型有关就转化为了在混合效应模型框架下对随机效应方差成分进行假设检验的问题。在H0条件下方差成分参数位于参数空间边缘,因此方差成分假设检验属于非标准的检验问题,常用的渐近似然比检验不再适用。为解决这个问题,本文在剖面对数似然函数的基础上建立似然比和限制性似然比统计量,借助谱分解技术获得统计量在H0条件下的精确有限样本分布。结果显示,似然比检验能够在各种情况下能有效控制I型错误;当罕见变异效应同方向时,负荷检验效能最高;当效应同时具有正向和负向时,所有检验方法都会遭受不同程度的效能损失,但似然比检验的统计效能高于其他方法,并且效能损失较低。为了进一步提高似然比检验的计算速度,本文提出了一种近似方法以及对应的参数估计方法。 第三章在线性混合效应模型似然比方差成分检验的基础上,进一步扩展了适合于logistic混合效应模型的似然比方差成分检验,以用于二分类表型的罕见变异关联性分析。首先通过惩罚伪似然算法估计logistic混合效应模型的参数,然后在工作应变量的基础上建立伪数据;将伪数据看做原始数据并且将工作应变量看做连续型表型,这样logistic混合效应模型的方差成分检验问题就转化为了线性混合效应模型框架下的方差成分检验问题,使得第二章中发展的似然比方差成分检验理论也同样能够应用到广义混合效应模型中。结果表明,伪似然比检验能够有效控制I型错误;罕见变异关联性分析方法在位点效应方向一致时,效能不如基于合并的负荷检验,但是在效应异质时,其统计效能高于其它方法;并且在这种情况下的效能损失也较少。与连续型表型关联性分析的结果类似。 第四章将似然比和限制性似然比方法应用到GAW17数据,实例结果显示,相对于现有方法,似然比方法具有更高的机会识别出罕见关联位点。 第五章讨论了似然比方法的优缺点,以及未来的研究方法。