论文部分内容阅读
基因组中存在大量的“活化石”,比如假基因。假基因是指功能基因通过基因复制或者逆转录过程保留在基因组中的具有功能缺失突变的拷贝。由于在长期的进化过程中积累了大量的结构突变(如移码),以致失去了编码蛋白的能力。假基因的鉴定和功能分析意义重大:首先,嵌合在基因组中的假基因,与亲本基因具有高度同源性,容易彼此混淆,假基因的确定有利于功能基因的正确鉴定。其次,假基因保留了数百万年前基因组祖先基因的分子记录,是研究进化和比较基因组学的重要材料。此外,研究显示有些假基因能够产生功能RNAs。最后,人类假基因SNP变异与重大疾病的风险值显著相关。因此,很有必要解析假基因的序列特征及其在染色体上的分布,并探索其生物功能。 为此,本论文利用毛果杨全基因组测序数据为研究材料,采用生物信息学技术方法,首先,鉴定了毛果杨基因组假基因并分析其分布特征;其次,应用假基因和功能基因比较体系,揭示其记录的基因组DNA在生物进化过程中的分子印迹;此外,发现假基因与miRNA之间的作用形式,初步揭示其生物学意义;最后,在假基因序列中发现丰富的SNP突变。本论文的研究结果有利于揭示毛果杨基因组进化过程中遗传事件的发生机制,并为假基因的功能研究提供了理论指导和技术支持。主要研究结果如下: 1.本论文运用PseudoPipe流程在毛果杨基因组共鉴定8,544个高信度的假基因,包括复制型、加工型和片段化三种假基因类型。假基因不均衡分布于毛果杨19条染色体,其分布主要受到功能基因分布密度和GC含量的影响。并且,大部分染色体上分布着假基因的热点分布区域。 2.假基因和亲本基因比较结果显示82.97%假基因的Ka/Ks比值小于1.0,但假基因的数量在0.1>Ka/Ks>0和Ka/Ks>3.0的值域内分别存在峰值。84.75%假基因产生于距今1.35亿年-164万年间,这期间毛果杨基因组经历了3次大规模复制事件。部分复制型假基因由于长片段插入到cDNA序列中成为内含了而形成。3bp插入和缺失是假基因主要的功能缺失类型。假基因和功能基因重复元件的类型相同,但丰度差异显著(P<0.01)。 3.6个假基因能够转录并衍生6个常见的miRNA基因,并存在106个假基因能够与功能基因竞争性结合相同的miRNA分子;上述假基因衍生或竞争性结合的miRNA分子的靶基因主要富集在与植物细胞进程和代谢相关的生物过程。 4.本论文在假基因序列共检测到76,852个显著的SNP(frequency<0.05),约每55bp就存在一个SNP突变;12种SNP突变类型中,碱基转换明显占优势,特别是G→A和C→T两种碱基转换类型。