论文部分内容阅读
基因组印记是一种亲本起源表达特异的单等位基因表达的表观遗传现象。印记基因参与多个生物学过程,印记的失调影响正常的生长发育,导致不同的病理状态。目前,已识别的小鼠印记基因约100个,识别全基因组潜在的印记基因有助于印记的机制和生物学功能的研究。研究表明DNA重复元件在印记基因和非印记基因中的分布有显著差异,可用于初步筛选印记基因。组蛋白修饰和DNA甲基化是两种重要的表观遗传修饰,与染色质调控相关并影响基因的表达。研究发现印记基因受表观遗传因子调控(包括DNA甲基化和组蛋白修饰的协同作用),表现其亲本等位的差异修饰标记。本文将遗传和表观遗传特征结合起来,通过计算印记基因在不同区域遗传和表观遗传特征的覆盖率,利用Wilcoxons秩和检验筛选出差异显著的67个特征,发现基因不同区域的SINE、H3K4me3、H3K9me3等修饰可作为印记基因的预测因子,并提出基于隐马尔科夫模型和支持向量机利用筛选出的特征预测小鼠印记基因的方法,两种方法从基因组分别预测出全基因组的1486和1927个印记基因,模型的训练精度分别达到87.56%和86.479%,对两者交集的1035个候选印记基因预测了其亲本表达方式。最后,分别为两种模型开发了界面友好的预测平台。基于计算的方法预测的小鼠的印记基因对指导实验检测印记基因有潜在的价值。