全基因组关联分析中荟萃分析的异质性和重叠数据问题的研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:fang82888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全基因组关联分析(Genome-wide association study,GWAS)是在人类全基因组范围内寻找与复杂性状或疾病相关联的遗传变异方法,这里的遗传变异主要是指单核苷酸多态性(Single nucleotide polymorphisms,SNP),占所有已知多态性的90%以上。荟萃分析被广泛应用于GWAS中,它综合多个研究的分析结果,在实现大的有效样本量的同时,提高发现新关联的概率。固定效应模型和随机效应模型是荟萃分析中常用的两种方法。固定效应模型假定各研究间的效应是一样的。在固定效应模型中,对SNP-环境交互作用的研究有SNP与SNP-环境交互作用的联合检验方法和荟萃回归两种分析方法。然而实际研究中,常见复杂疾病或表型通常由多个不同的遗传机制产生时,会具有遗传异质性。GWASs发现的变异在具有不同人口历史的人群中也具有不同的效应大小,甚至不同的关联方向。最近开展了许多大型跨种族人群的荟萃分析,其中通常包含遗传异质性。因此在荟萃分析时需要使用随机效应模型以便考虑遗传效应中的异质性。传统的随机效应模型只检验SNP的固定效应,将异质性作为随机效应并将其视为固定效应方差的一部分。最近的研究建议应同时检验SNP的固定效应和随机效应,该方法已被证明比传统的随机效应方法具有更高的检验统计力。然而,该方法只能对SNP的遗传主效应进行统计检验,对于SNP-环境交互作用检验目前仍缺乏相应的模型和方法。另外,在GWAS研究的实践中,为了节约研究成本或者研究人员无意间会使用一些重叠数据,忽略这些重叠数据会导致假阳性结果。最近的研究提出在检验SNP的遗传主效应时考虑重叠数据问题的荟萃分析方法。同样,目前仍然没有相应的荟萃分析方法用来在存在重叠数据的情况下检验SNP-环境交互作用。本文研究了GWAS中SNP-环境交互作用检验中的异质性和重叠数据问题,主要工作包括以下内容:
  首先,提出一项在异质性存在情况下检验SNP-环境交互作用的荟萃分析方法。将SNP与SNP-环境交互作用的异质性作为随机效应引入到荟萃回归分析模型中。提出一种新的SNP-环境交互作用检验方法,称其为随机效应荟萃回归分析方法,用来同时检验SNP-环境交互作用的固定效应和随机效应。基于该模型,还进一步提出一个新的统计检验用来同时检验SNP与SNP-环境交互作用的固定效应及其随机效应。对于提出的方法进行仿真实验,研究它们的原分布和检验统计力。结果表明,在异质性效应较大的情况下,新方法比传统的随机效应模型和常规的荟萃回归分析方法具有更高的统计检验力。这个方法是适用于不同场景的简单有效的方法。此外,当已知基因-环境交互作用存在时,它还可以被进一步推广用来对不同的交互作用方式进行后验估计。
  其次,提出另外一种随机效应模型方法,用来在异质性存在情况下进行SNP与SNP-环境交互作用的联合检验,并同时给出SNP-环境交互作用检验方法。该方法基于似然比函数检验,不需要分层水平的统计量数据。仿真实验表明这个检验方法与随机效应荟萃回归分析方法具有相似的检验统计力。该方法可以用于当研究间没有分层水平的统计数据时交互作用的统计检验。由于这个方法需要预先设定一个SNP-环境交互作用的函数形式,如果需要检验一个新的交互作用假设,该方法需要从新以新的模型在各研究数据中进行全基因组分析。
  接着,提出一个重叠数据荟萃回归方法用来解决在研究间存在重叠数据情况下SNP-环境交互作用的检验问题。基于Lin和Han的相关研究,引入研究的层间相关矩阵,将常规荟萃回归模型的方差和协方差矩阵进行推广。基于这一模型,给出SNP-环境交互作用以及SNP与SNP-环境交互作用联合效应的统计检验。通过仿真实验,检验该方法的原分布和在不同数据重叠率下的检验统计力。实验结果证明该方法是有效的,同时达到了与在荟萃分析之前预先去除重叠样本的方法即数据拆除法相媲美的检验统计力。另一方面,实验结果表明如果忽略重叠数据会导致原分布对应的点向上偏移。因此,该重叠数据荟萃回归方法有效地处理了数据重叠问题。
  最后,在随机效应荟萃回归分析方法和重叠数据荟萃回归方法的基础上,提出一种同时考虑异质性和数据重叠问题的随机效应模型下的有重叠数据的荟萃回归分析方法。对检验SNP-环境交互作用和SNP与SNP-环境交互作用联合效应的似然比统计量进行仿真验证。使用检验统计力评估我们的方法与固定效应模型下的有重叠数据的荟萃分析方法相比的优越性。仿真结果证明该方法在数据重叠、异质性存在的情况下,比固定效应模型下的有重叠数据的荟萃分析方法具有更高的检验统计力。
其他文献
随着人们健康意识的提高,尤其是新冠肺炎爆发以来,居家锻炼已成为一种趋势。跑步机作为一种重要的室内健身器材得到了较为广泛的应用。人在跑步过程中,由于每个运动者的体重和速度均不一样,导致负载转矩变化很大。因此,本文旨在开发一款跑步机专用的交流调速控制器,使其在脉冲负载的作用下,电机转速平缓调节,实现舒适控制。本文对跑步机的数学模型、矢量控制、电压空间脉宽矢量和脉冲型负载特性作了详细的分析,并建立了基于
学位
随着智能电网时代的到来,传统的人工线路巡检方式费时费力,危险性较高,已经逐步被自动检测技术所取代。针对输电线路中的绝缘子利用图像融合技术进行故障检测展开研究。通过不同的传感器获得绝缘子的红外图像以及可见光图像,利用图像融合技术将不同信息进行融合,根据融合图像对绝缘子缺陷进行分析。论文研究内容如下所示。首先,对于绝缘子的检测现状进行分析,提出利用图像融合方法进行绝缘子缺陷检测。图像融合理论进行系统研
学位
功率变换器电路由于电感、电容和开关管等非线性器件的存在,给系统带来极强的非线性,主要表现为次谐波振荡、混沌和分叉等,这些现象使电路运行进入未知的方向,严重时将可能导致系统瘫痪,因此需要对功率变换器的非线性展开深入的研究。论文以峰值电流型DC/DC Boost变换器为研究对象,针对变换器工作在大占空比时出现的次谐波振荡现象进行研究,寻找可行性解决方案,改善变换器的运行稳定性。论文的主要工作以及取得的
绝缘子作为一种在架空输电线路上用来实现电气绝缘和机械固定的重要绝缘控件,其数量庞大且长期暴露在自然环境中,受气候、温度、自身耐久等因素的影响容易发生自爆、破损、缺失等故障问题,对于电力的稳定传输有很大的影响,因此对于绝缘子的巡检是不可或缺的。随着无人机技术的不断发展,工作人员利用无人机对待检测的绝缘子进行航拍,凭借肉眼对采集到的绝缘子图像进行判断。该方法看似是一种可靠的方法,但实际由于无人机拍摄到
学位
在中压配电网中,为了监测母线对地电压,通常在母线上装设一次绕组接为星形、中性点直接接地的电磁式电压互感器(简称PT)。由于电磁式电压互感器励磁电感的非线性特性,在外界电压的扰动下,易导致铁芯饱和,造成励磁电感下降,与中压配电网中的对地电容参数共同作用,引起铁磁谐振,使配电网出现过电压。这种过电压轻则仅引起供电中断,造成一定经济损失,重则可能引起重大设备的损坏和人身伤亡事故。文中首先给出了各类型铁磁
风能由于清洁、可再生和分布面积广的优点得到广泛应用。风电作为分布式电源并入电网,在一定程度上可以充分利用风能资源,缓解局部用电紧张。但由于风电的不可控性和多变性,大量风电并网会改变原有系统结构,改变潮流分布,使网损增高,影响电网电压质量。因此,研究含有风电源的配电网无功优化具有十分重要的意义。本文首先分析了风力发电国内外发展现状,以及风电并网后所产生的若干问题,并对含风电源的配电网优化方法作了研究
学位
永磁同步电机因其结构简单、质量轻、体积小、功率密度高而被广泛应用于铁路牵引、航天、纺织、军事等各个领域。随着生产技术的不断进步,对永磁同步电机交流伺服系统在精确性、快速性、稳定性等方面的要求也逐渐提高。在这一前提下,传统的控制方法已愈难满足高性能控制需求,急需一种高性能交流电机控制策略应对要求更高的控制场合。在众多先进控制技术中模型预测控制由于其结构简单、易于处理复杂的非线性系统,而被广泛应用于电
电力变压器是电力系统最重要的电气设备之一,因此,其故障诊断一直得到学术界与工程界的广泛重视.目前110kV及以上等级的大型电力变压器仍主要采用油纸绝缘结构,在正常老化过程及故障初期,油纸绝缘劣化所形成的低分子烃、氢气以及碳的氧化物等气态化合物绝大部分将溶解于油中,且变压器没中溶解的各种气体成分的相对数量和形成速度主要取决于故障点能量的释放形式及故障的严重程度.油中溶解气体分析(Dissolved
SOI大大降低了RF模拟电路和数字逻辑元件的串扰,可以很容易和无源器件相集成,高阻抗SOI和GPSOI衬底加强了这些优势,在CMOS射频集成电路中吸引了广泛注意。本论文在大量调研的基础上,详细研究了SIMOX HRSOI和Smart-cut方法制备GPSOI的工艺条件及其在单片集成电路中必不可缺少的、有多种应用的片上无源器件-CPW和集成电感。在本所的工艺线上进行了大量的实验研究,得到了以下主要结
学位
InAs1-xSbx是重要的红外材料,已制成各种类型的室温中红外(3~5μm)光电器件,近10年来,8~12μm室温工作InAS1-xSbx光电器件的报导使其成为极具前途的室温长波红外探测材料,再次激发了人们的研究热情。In1-xMnxSb是Ⅲ-Ⅴ族窄带隙稀磁半导体材料(DMS),可用于长波红外自旋光电子器件的制备。本论文根据水平式液相外延(LPE)生长原理,建立和完善了水平式多槽滑移石墨舟LPE
学位