论文部分内容阅读
Helitron转座子是一类能够以滚环复制方式进行转座的DNA转座子,它容易插入基因的临近区域,尤其是具有自主捕获基因片段的重要特性,因此在基因组演化及调控基因表达方面具有重要的作用。但是,作为一种本世纪才发现的转座子,Helitron转座子的研究在注释和鉴定方法、插入和起源的时间等方面仍不完全清楚。因此,本研究利用生物信息学计算结合Python、Perl脚本程序对已经发表的302种植物基因组中的Helitron转座子进行了注释和鉴定,并对其保守结构、插入时间和位置特征、捕获基因等方面进行了比较分析。主要研究结果如下:
1.植物基因组中Helitron转座子的鉴定和含量分析
为了全面了解已测序植物基因组中Helitron的含量等基本特征,我们首先建立了以HelitronScanner软件为主,人工校对为辅的Helitron转座子鉴定标准,并结合Python、Perl脚本程序在302种植物基因组中鉴定出Helitron转座子共984459条,Helitron数目最多的物种是野生二粒小麦(Triticum dicoccoides),共有129122条;最少的是温泉红藻(Galdieria sulphuraria),仅有2条;302种植物基因组中Helitron平均长度为8650bp,平均密度为3.47条/Mb,占基因组平均比例为3.00%。Helitron转座子在不同物种中的含量差异较大,平均密度范围在0.02条/Mb-28.83条/Mb之间;占基因组比例最大的物种是玉米(Zea mays),比例为24.69%,最小的是夏葡萄(Vitis aestivalis),占基因组比例为0.002%。在不同植物类群中,单子叶植物的Helitron含量最高,其中,禾本科植物的Helitron转座子平均含量远高于其他科。对Helitron转座子的数量和总长度分别与基因组大小的相关性分析表明,转座子的数量和总长度与基因组大小均成正相关,说明Helitron的插入是植物基因组膨胀的原因之一。
2.植物基因组中Helitron转座子5’和3’端保守结构分析
我们对Helitron转座子5’末端和3’末端各50bp序列的碱基组成的分析表明,绝大多数植物Helitron转座子具有保守的5’-TC开头和3’-CTRR结尾,5’末端富含AT碱基,3’末端的茎环结构处GC含量很高。不同植物类群中Helitron的末端结构碱基构成比例基本是一致的,仅双子叶植物没有严格遵循5’-TC和3’-CTRR的末端特征,在5’末端前两个位点和3’末端最后4个位点分别表现出了0.5%以下的差异性,暗示着双子叶植物对Helitron转座子的末端序列的包容度更高。
3.植物基因组中Helitron转座子的扩张时间
为了了解Helitron转座子在植物基因组中的插入和扩张模式,我们使用Kimura双参数模型对204种植物基因组中共158302条Helitron转座子的插入时间进行了计算,结果表明,现存植物基因组中的Helitron转座子经历了两个快速扩张阶段,第一次扩张发生在2500-1900万年前之间,在2200万年前达到峰值。第二次扩张发生在最近400万年,在距今约20万年时达到峰值,有77.1%的Helitron转座子是在这一阶段插入植物基因组中的。并且Helitron的两次扩张是伴随着植物类群第三次全基因组复制事件发生的,说明现存植物基因组中的Helitron转座子可能是由于第三次全基因组复制事件而产生的。
4.十字花科和茄科植物基因组中Helitron转座子插入位置和邻近基因分析
为了了解植物基因组中Helitron转座子插入基因组的位置模式特征,我们选择了十字花科和茄科植物中有注释文件的18个物种,对Helitron转座子插入位置和邻近基因的功能进行了分析。结果显示,Helitron在植物基因组中的插入在不同植物类群中存在较大差异,如十字花科植物基因组中约69%-89.7%的Helitron都插入到基因侧翼区域,而茄科植物Helitron在基因侧翼插入的频率较低,仅有14.46%-38.65%。我们又分析了18个物种的基因组特征,发现这种差异可能是由于基因组内重复序列的含量不同造成的。对这些Helitron的邻近基因做GO富集分析表明,Helitron插入位置在临近基因功能选择上是随机的,没有表现出明显的共同偏好。
5.十字花科和茄科植物基因组中Helitron转座子捕获基因分析
对十字花科和茄科18个物种Helitron转座子捕获基因的分析结果显示,十字花科中38.29%-45.76%的Helitron转座子捕获了完整的基因,茄科植物捕获完整基因的Helitron转座子仅占总数的4.22%-15.99%。对捕获的基因做GO富集分析,获得结果的9个物种中有6个富集到与金属离子结合相关的term。这一结果可能与Helitron转座所需的Rep结构域需要结合二价金属离子有关。
综上所述,本研究全面鉴定了302种植物基因组中的Helitron转座子,对其在不同植物类群中的含量、末端结构和插入时间进行探讨,并重点分析了十字花科和茄科植物中Helitron转座子插入位置的偏好性和捕获基因的情况,对相关基因的功能进行富集分析。研究结果极大丰富了植物转座子数据库,为Helitron转座子在植物基因组中的起源及演化研究提供了重要的基础资料。
1.植物基因组中Helitron转座子的鉴定和含量分析
为了全面了解已测序植物基因组中Helitron的含量等基本特征,我们首先建立了以HelitronScanner软件为主,人工校对为辅的Helitron转座子鉴定标准,并结合Python、Perl脚本程序在302种植物基因组中鉴定出Helitron转座子共984459条,Helitron数目最多的物种是野生二粒小麦(Triticum dicoccoides),共有129122条;最少的是温泉红藻(Galdieria sulphuraria),仅有2条;302种植物基因组中Helitron平均长度为8650bp,平均密度为3.47条/Mb,占基因组平均比例为3.00%。Helitron转座子在不同物种中的含量差异较大,平均密度范围在0.02条/Mb-28.83条/Mb之间;占基因组比例最大的物种是玉米(Zea mays),比例为24.69%,最小的是夏葡萄(Vitis aestivalis),占基因组比例为0.002%。在不同植物类群中,单子叶植物的Helitron含量最高,其中,禾本科植物的Helitron转座子平均含量远高于其他科。对Helitron转座子的数量和总长度分别与基因组大小的相关性分析表明,转座子的数量和总长度与基因组大小均成正相关,说明Helitron的插入是植物基因组膨胀的原因之一。
2.植物基因组中Helitron转座子5’和3’端保守结构分析
我们对Helitron转座子5’末端和3’末端各50bp序列的碱基组成的分析表明,绝大多数植物Helitron转座子具有保守的5’-TC开头和3’-CTRR结尾,5’末端富含AT碱基,3’末端的茎环结构处GC含量很高。不同植物类群中Helitron的末端结构碱基构成比例基本是一致的,仅双子叶植物没有严格遵循5’-TC和3’-CTRR的末端特征,在5’末端前两个位点和3’末端最后4个位点分别表现出了0.5%以下的差异性,暗示着双子叶植物对Helitron转座子的末端序列的包容度更高。
3.植物基因组中Helitron转座子的扩张时间
为了了解Helitron转座子在植物基因组中的插入和扩张模式,我们使用Kimura双参数模型对204种植物基因组中共158302条Helitron转座子的插入时间进行了计算,结果表明,现存植物基因组中的Helitron转座子经历了两个快速扩张阶段,第一次扩张发生在2500-1900万年前之间,在2200万年前达到峰值。第二次扩张发生在最近400万年,在距今约20万年时达到峰值,有77.1%的Helitron转座子是在这一阶段插入植物基因组中的。并且Helitron的两次扩张是伴随着植物类群第三次全基因组复制事件发生的,说明现存植物基因组中的Helitron转座子可能是由于第三次全基因组复制事件而产生的。
4.十字花科和茄科植物基因组中Helitron转座子插入位置和邻近基因分析
为了了解植物基因组中Helitron转座子插入基因组的位置模式特征,我们选择了十字花科和茄科植物中有注释文件的18个物种,对Helitron转座子插入位置和邻近基因的功能进行了分析。结果显示,Helitron在植物基因组中的插入在不同植物类群中存在较大差异,如十字花科植物基因组中约69%-89.7%的Helitron都插入到基因侧翼区域,而茄科植物Helitron在基因侧翼插入的频率较低,仅有14.46%-38.65%。我们又分析了18个物种的基因组特征,发现这种差异可能是由于基因组内重复序列的含量不同造成的。对这些Helitron的邻近基因做GO富集分析表明,Helitron插入位置在临近基因功能选择上是随机的,没有表现出明显的共同偏好。
5.十字花科和茄科植物基因组中Helitron转座子捕获基因分析
对十字花科和茄科18个物种Helitron转座子捕获基因的分析结果显示,十字花科中38.29%-45.76%的Helitron转座子捕获了完整的基因,茄科植物捕获完整基因的Helitron转座子仅占总数的4.22%-15.99%。对捕获的基因做GO富集分析,获得结果的9个物种中有6个富集到与金属离子结合相关的term。这一结果可能与Helitron转座所需的Rep结构域需要结合二价金属离子有关。
综上所述,本研究全面鉴定了302种植物基因组中的Helitron转座子,对其在不同植物类群中的含量、末端结构和插入时间进行探讨,并重点分析了十字花科和茄科植物中Helitron转座子插入位置的偏好性和捕获基因的情况,对相关基因的功能进行富集分析。研究结果极大丰富了植物转座子数据库,为Helitron转座子在植物基因组中的起源及演化研究提供了重要的基础资料。