论文部分内容阅读
基因复制为基因组产生遗传创新提供可能,基因串联复制是基因复制及机体基因组演化的关键机制之一。鉴于串联复制基因的重要生物学意义,研究人员已经对一些重要植物,如拟南芥、水稻、白菜中的串联复制基因的基因组学特征进行了全面研究。甘蔗具有高光效和高生物量的特征,是世界上最重要的糖料作物和能源作物。由于甘蔗遗传背景的复杂性,以及同源多倍体甘蔗属割手密种的全基因组刚被破译等原因,尚未报道包括串联复制基因在内的主要基因组学特征。因此,本研究基于比较基因组学手段鉴定了甘蔗割手密种全基因组串联复制基因,并应用系列转录组表达谱分析该类型基因的表达模式。最后,研究结合了甘蔗的关键生物学特性,分析重要性状相关基因家族中串联阵列的表达特征,以期探究甘蔗串联复制基因的演化及其生物学意义。主要结果如下:
(1)甘蔗割手密种串联复制基因(SsTDGs)的鉴定
应用MCScanX等比较基因组学工具,在同源四倍体甘蔗割手密种AP85-441的基因组中鉴定出4653个串联复制基因(包含等位基因在内共6794条序列)。在四个同源染色体组中,串联复制基因的数量相近。在这些串联复制基因中,1个SsTDGs含有四个等位基因,30个含有三个等位基因,438个含有两个等位基因。随后鉴定了甘蔗近缘种,包括高粱、玉米和水稻中的串联复制基因。串联基因对在甘蔗和玉米中的序列发散(Ks)分布较高粱和水稻更广,表明近期在甘蔗和玉米中的全基因组复制事件可能影响串联复制基因的序列发散。基于GO注释、KEGG注释及COG注释方法,将甘蔗串联基因对分成四个组别进行了功能分析,结果显示30.4~86.2%的串联基因对属于功能较为保守的,1.7~11.1%的串联基因对的基因具有不同的功能注释结果,13.9~62.7%的串联基因对的基因均没有注释结果,2.3~5.2%的串联基因对可能丢失了其中一个基因的功能。通过这四个组别的选择压力分析,观察到不同组别中均有近期快速演化的基因。
(2)SsTDGs在发育阶段和叶片发育梯度的表达模式
为探究串联复制基因的生物学意义,对SsTDGs在不同生长发育阶段的表达谱进行了分析。结果显示,在甘蔗割手密种四个同源染色体上具有表达丰度的串联复制基因的数量相近,这符合同源多倍体甘蔗的表达特征。通过生长发育转录组分析得到211个(3.1%)在三个时期差异表达的串联复制基因,其表达模式聚类生成3个集群(DClusters)并进行GO富集分析。结果显示,DCluster1中120个(56.9%)基因在苗期表达水平较高,显著富集在次生代谢物生物合成过程。DCluster3中聚类的37个(17.5%)差异表达串联复制基因在苗期表达水平较低,这些基因与光合作用膜、细胞器亚层、对含氧化合物的响应等功能相关。通过叶片发育梯度转录组分析得到3038个(44.7%)在叶段1、6、10、15差异表达的串联复制基因,将筛选后得到的差异串联复制基因表达模式聚成5个集群(LClusters)。GO富集分析结果显示,LCluster1中69个(5.7%)基因在叶段发育过程中具有较高表达水平,它们与光合作用膜、类囊体、氧化还原酶活性等相关,并在受伤应答、防御响应、催化活性等有所富集。LCluster5中171个(14.1%)基因的表达趋势随着叶片成熟而降低,该集群在木质素代谢过程、核糖体亚基、胞间连丝等中有所富集。此外,四个同源染色体上的SsTDGs在叶基(第1-3节)、叶库源过渡区(第4-6节)及光合活性区域(第7-15节)的表达总和存在差异。这些结果初步说明基因的串联复制可能与甘蔗的主要生物学性状如高光合、生物量等存在相关性。
(3)糖转运蛋白和光合途径相关基因家族中的串联阵列
糖分积累和高光效是甘蔗的主要生物学性状,相关基因家族中均有串联复制的基因成员。结合两个系列转录组的表达谱,显示在甘蔗重要生物学性状相关基因家族串联阵列中,分别共有92个(70.2%)和97个(74.0%)基因平均FPKM值<1,说明相关串联阵列中普遍存在功能冗余的现象。
在甘蔗糖转运基因超家族中共搜索到24个串联阵列,STP、SFP、PLT、SWEET基因家族分别有4个(4.9%)、3个(13.6%)、4个(6.2%)、6个(11.3%)串联复制基因。C4光合途径关键酶基因家族中共搜索到10个串联阵列。NADP-ME、PPDK-RP、CA基因家族分别含有1个(6.7%)、2个(28.6%)、2个(25.0%)串联复制基因。为评估串联复制对转录因子基因家族的影响,在参与甘蔗糖分代谢和光合作用调控的WRKY基因家族中,搜索到26个WRKY串联阵列,包含了24个(8.2%)串联复制基因。
同时,串联复制基因的表达水平普遍高于全基因组或片段复制基因的串联阵列包括SsPLT-TAs、SsSWEET-TAs、SsPPDK-RP-TAs以及SsWRKY-TA5、6、8、11、14。而SsWRKY-TA3、9、13、16以及26中,串联复制基因与同阵列的全基因组或片段复制基因具有相近的表达水平。这些结果进一步说明甘蔗的糖转运、光合以及转录调控网络受基因串联复制影响。
(1)甘蔗割手密种串联复制基因(SsTDGs)的鉴定
应用MCScanX等比较基因组学工具,在同源四倍体甘蔗割手密种AP85-441的基因组中鉴定出4653个串联复制基因(包含等位基因在内共6794条序列)。在四个同源染色体组中,串联复制基因的数量相近。在这些串联复制基因中,1个SsTDGs含有四个等位基因,30个含有三个等位基因,438个含有两个等位基因。随后鉴定了甘蔗近缘种,包括高粱、玉米和水稻中的串联复制基因。串联基因对在甘蔗和玉米中的序列发散(Ks)分布较高粱和水稻更广,表明近期在甘蔗和玉米中的全基因组复制事件可能影响串联复制基因的序列发散。基于GO注释、KEGG注释及COG注释方法,将甘蔗串联基因对分成四个组别进行了功能分析,结果显示30.4~86.2%的串联基因对属于功能较为保守的,1.7~11.1%的串联基因对的基因具有不同的功能注释结果,13.9~62.7%的串联基因对的基因均没有注释结果,2.3~5.2%的串联基因对可能丢失了其中一个基因的功能。通过这四个组别的选择压力分析,观察到不同组别中均有近期快速演化的基因。
(2)SsTDGs在发育阶段和叶片发育梯度的表达模式
为探究串联复制基因的生物学意义,对SsTDGs在不同生长发育阶段的表达谱进行了分析。结果显示,在甘蔗割手密种四个同源染色体上具有表达丰度的串联复制基因的数量相近,这符合同源多倍体甘蔗的表达特征。通过生长发育转录组分析得到211个(3.1%)在三个时期差异表达的串联复制基因,其表达模式聚类生成3个集群(DClusters)并进行GO富集分析。结果显示,DCluster1中120个(56.9%)基因在苗期表达水平较高,显著富集在次生代谢物生物合成过程。DCluster3中聚类的37个(17.5%)差异表达串联复制基因在苗期表达水平较低,这些基因与光合作用膜、细胞器亚层、对含氧化合物的响应等功能相关。通过叶片发育梯度转录组分析得到3038个(44.7%)在叶段1、6、10、15差异表达的串联复制基因,将筛选后得到的差异串联复制基因表达模式聚成5个集群(LClusters)。GO富集分析结果显示,LCluster1中69个(5.7%)基因在叶段发育过程中具有较高表达水平,它们与光合作用膜、类囊体、氧化还原酶活性等相关,并在受伤应答、防御响应、催化活性等有所富集。LCluster5中171个(14.1%)基因的表达趋势随着叶片成熟而降低,该集群在木质素代谢过程、核糖体亚基、胞间连丝等中有所富集。此外,四个同源染色体上的SsTDGs在叶基(第1-3节)、叶库源过渡区(第4-6节)及光合活性区域(第7-15节)的表达总和存在差异。这些结果初步说明基因的串联复制可能与甘蔗的主要生物学性状如高光合、生物量等存在相关性。
(3)糖转运蛋白和光合途径相关基因家族中的串联阵列
糖分积累和高光效是甘蔗的主要生物学性状,相关基因家族中均有串联复制的基因成员。结合两个系列转录组的表达谱,显示在甘蔗重要生物学性状相关基因家族串联阵列中,分别共有92个(70.2%)和97个(74.0%)基因平均FPKM值<1,说明相关串联阵列中普遍存在功能冗余的现象。
在甘蔗糖转运基因超家族中共搜索到24个串联阵列,STP、SFP、PLT、SWEET基因家族分别有4个(4.9%)、3个(13.6%)、4个(6.2%)、6个(11.3%)串联复制基因。C4光合途径关键酶基因家族中共搜索到10个串联阵列。NADP-ME、PPDK-RP、CA基因家族分别含有1个(6.7%)、2个(28.6%)、2个(25.0%)串联复制基因。为评估串联复制对转录因子基因家族的影响,在参与甘蔗糖分代谢和光合作用调控的WRKY基因家族中,搜索到26个WRKY串联阵列,包含了24个(8.2%)串联复制基因。
同时,串联复制基因的表达水平普遍高于全基因组或片段复制基因的串联阵列包括SsPLT-TAs、SsSWEET-TAs、SsPPDK-RP-TAs以及SsWRKY-TA5、6、8、11、14。而SsWRKY-TA3、9、13、16以及26中,串联复制基因与同阵列的全基因组或片段复制基因具有相近的表达水平。这些结果进一步说明甘蔗的糖转运、光合以及转录调控网络受基因串联复制影响。