论文部分内容阅读
目前,随着基因组学研究的深入,全面了解个体和群体间基因组序列的变异或多态性已成为可能,并日益显示其重要性。单核苷酸多态性(SNP)由于数量巨大,分布广,易于自动化批量检测,因而被认为是新一代的遗传标记。近些年来,基于单核苷酸多态性SNP和单体型技术的研究课题日益增多,特别是在医学遗传学的研究领域。无论是进行单基因疾病还是多基因疾病的研究,研究人员都迫切需要了解SNP和单体型分析的新技术。
本研究采用置信区间(ConfidenceInterVals)、FGT(Four Gamete Tests)规则、连锁不平衡的稳定连接(SolidSpine of LD)三种常用单体型板块挖掘方法进行研究,分别对GAW14、GAW15会议提供的两套疾病—对照数据进行分析,识别群体中的单体型板块。本文提出将不同单体型板块识别方法融合的思想,将识别结果取交集或并集作为一种新的单体型板块识别方法,并分析获得了多个单体型板块集合。本文根据各候选单体型板块集合,分别挖掘与复杂疾病相关的单体型。通过观察各组候选疾病相关单体型对疾病人群聚类的有效性,评价它们对疾病人群的鉴别能力。结果显示:融合置信区间和连锁不平衡的稳定连接两种单体型板块识别方法(交集得到单体型板块集合,A∩C)获得的疾病相关单体型,具有最高的疾病样本鉴别效能。这种单体型板块识别方法融合技术,提高了对疾病相关单体型的挖掘效率。