论文部分内容阅读
转座子(TEs)广泛分布在原核和真核生物基因组中。它们能够从染色体的一个位置移动到另一个位置,从而增加其拷贝数,这个过程被称为转座。转座子在基因组大小,新基因的产生,基因的表达调控及小RNA的产生等方面发挥着重要作用。微型反向重复转座子(MITE)是一类截短的DNA转座子,具有末端反向重复(terminal inverted repeat,TIR)序列和侧翼靶位点重复(target site duplication,TSD)序列,MITE本身不含有ORF区,其转座依赖于同源自主DNA转座子所提供的转座酶。MITE广泛分布于真核生物基因组中,目前MITE转座子的研究主要集中在种类鉴定、含量分析及转座机制等方面,而对其功能研究还较少。
桑树是多年生落叶性的木本植物,除广泛用于养蚕外,桑树还具有重要的生态价值和药用价值。桑树是桑科的代表植物,其全基因组的测序已于2013年完成,为在全基因组水平上全面鉴定和深入研究MITE功能提供了契机。目前,对于桑树MITE转座子的研究只停留在简单的鉴定和分类上,具体系统深入的研究还没有报道。本文利用MITE-Hunter,MITEdigger和RSPB这三个软件对川桑基因组MITE转座子进行全面鉴定,并对鉴定到的MITE转座子进行了系统的超家族和家族分类。通过生物信息学的方法,对MITE转座子的扩增模式、插入偏好性、衍生小RNA以及与选择性剪接相关性进行了分析。利用PCR和转基因的方法,对MITE转座子引起的基因组多态性、MITE转座子的调控作用以及MITE转座子引起的选择性剪接进行了验证。通过甲基化组、转录组和小RNA组对模拟处理和灰霉菌处理的川桑叶片进行了联合分析。明确了基因和转座子在响应灰霉菌时的动态甲基化变化,并解析了这种动态甲基化的重要作用。本研究的主要结果如下:
1.川桑基因组中MITE的种类和含量
在川桑基因组中总共得到286122条MITE相关序列。MITE占川桑基因组的比列高达13.83%,超过了目前植物中基因组占比最高的水稻(10%)。根据TSD和TIR序列,将鉴定到的桑树MITE划分到PIF/Harbinger,Tc1/Mariner,Mutator和hAT四个超家族。四个已知的MITE超家族中Tc1/Mariner基因组占比最高(5.11 %)。
2.MITE在川桑基因组中的扩增模式及插入偏好性
通过对MITE各家族核苷酸差异度分析,有51个家族呈现出单峰分布,44个家族呈现双峰分布,剩下的家族呈现多峰分布或无峰平滑分布。进一步利用邻接法构建系统发育树发现,具有单峰分布的家族,其系统树呈现出明显的星状,没有明显的分支,表明这些家族的成员都是从同一个祖先经过快速扩增而来的。而具有双峰甚至多峰分布的家族,其系统树分为几个明显的分支,意味着这些家族在演化过程中,可能从祖先分化出了几个分支。为了进一步探索MITE的扩增,研究了不同倍性桑树资源中4个MITE的插入多态性。其中有两个MITE在所有桑树资源中都能检测到,表明这两个MITE在不同倍性桑树资源中被固定下来,而另外两个MITE在桑树染色体增多的过程中被激活。
为分析桑树MITE插入基因组位置的偏好性,首先对插入到基因序列(GS)和基因间序列(IS)的MITE进行统计,发现MITE整体呈线性均匀排布在基因组上。之后对每个MITE超家族在全基因组水平的分布及基因和上下游2k的分布进行了比较,发现除了Tc1/Mariner超家族,其他三个超家族都倾向于插入到基因附近。为了分析MITE伴随基因表达的比例,对插入基因外显子的MITE进行了统计,在MITE超家族中,PIF/Harbinger的表达率最高。有MITE插入的基因在五个组织中的表达比例分别为:花(1.65%)、芽(1.58%)、叶(1.58%)、皮(1.53%)和根(1.40%)。这些结果表明,在五个被分析的组织中,有MITE插入的基因表达比率是相对一致的。
3.MITE调控作用及对选择性剪接的影响
MnM2插入基因附近并在不同桑树资源中存在多态性,为进一步研究其是否具有调控作用,将其插入到MnANR基因附近并进行异源表达。结果显示,含有MnM2的转基因幼苗中MnANR表达水平显著高于不含有MnM2的转基因幼苗。
与MITE相关的选择性剪接在五种组织中的比例分别为:花(5.00%)、叶(4.26%)、根(4.02%)、皮(3.31%)和芽(2.58%)。五种组织中MITE在剪接位点的比例分别为:花(0.51%)、皮(0.50%)、芽(0.48%)、根(0.45%)和叶(0.43%)。为了进一步验证MITE对选择性剪接的影响,分析了三个桑树资源中的一个MnPR-4基因,该基因内含子包含一个MITE(MnP4),导致第二个外显子被选择性剪接。同时MnP4在不同桑树资源中存在多态性,MnP4缺失的桑树资源中MnPR-4选择性剪接也会缺失。
4.基因和转座子甲基化模式及差异甲基化
在全基因组中,模拟样品中mCG、mCHG和mCHH位点占总CG、CHG和CHH位点的平均百分比分别为35.5%、26.6%和37.9%,接种样品中mCG、mCHG和mCHH位点占总CG、CHG和CHH位点的平均百分比分别为33.8%、25.5%和40.7%。与模拟样品相比,接种样品的基因和转座子及其侧翼的胞嘧啶甲基化水平升高。mCG水平在基因体及其侧翼区域均较高,而mCHG和mCHH水平在基因体中较低,在基因侧翼区域较高。在转座子区域的mCG、mCHG和mCHH水平远高于侧翼区域。这表明DNA甲基化在桑树转座子沉默中起重要作用。MITE的甲基化模型与转座子甲基化模型一致,说明MITE在转座子甲基化中起主导作用。
对于基因启动子区域差异甲基化进行了分析,其中mCG、mCHG和mCHH分别有976(811个低差异甲基化)、1,003(774个低差异甲基化)和12,779(2,842个低差异甲基化)个差异甲基化。之后进一步对这些启动子存在差异甲基化的基因进行KEGG通路分析,KEGG通路分析显示,植物-病原体相互作用(87.50%低差异甲基化)是mCG差异甲基化的主要基因类别,碳代谢(73.68%低差异甲基化)是mCHG差异甲基化的主要基因类别,代谢(21.83%低差异甲基化)是mCHH差异甲基化的主要基因类别。这些结果表明,mCG和mCHG通过增强抗病和碳代谢相关基因的表达参与了对灰霉病的抵抗,而mCHH通过抑制代谢通路相关基因的表达参与了对灰霉病的抵抗。分析了CG、CHG和CHH差异甲基化在基因和转座子中的比例。差异甲基化在转座子中所占比例显著高于基因中,尤其是CHG和CHH中,CHH差异甲基化有63.59%分布在转座子中。进一步分析发现,差异甲基化主要分布在MITE转座子上。基因启动子区域影响转录调控,启动子甲基化程度的差异影响转录表达。在启动子区,CG、CHG和CHH差异甲基化发生在转座子上的比例分别为40.60%、43.13%和67.22%。启动子差异甲基化主要分布在MITE转座子上,这表明MITE在通过RdDM途径调控基因表达中发挥着重要作用。
5.桑树MnMET1的沉默增强了桑叶对灰霉病的抗性
利用病毒诱导基因沉默(VIGS)对MnMET1进行沉默,沉默MnMET1表达的植物对灰霉病菌的生长有明显的抑制,同时鉴定到一个抗性基因Morus002632在MnMET1沉默的植株中增强表达。这表明,MnMET1的沉默可以增强桑树抗性基因的表达,从而增强桑树对灰霉病的抗性。
本研究系统鉴定了桑树中MITE转座子,全面解析了MITE转座子在桑树中的功能,有助于进一步了解桑树基因组的进化。结合甲基化组、转录组和小RNA组联合分析,首次系统解析了转座子-基因-甲基化-灰霉菌之间的关系,明确了MITE转座子通过RdDM调控基因的重要性。
桑树是多年生落叶性的木本植物,除广泛用于养蚕外,桑树还具有重要的生态价值和药用价值。桑树是桑科的代表植物,其全基因组的测序已于2013年完成,为在全基因组水平上全面鉴定和深入研究MITE功能提供了契机。目前,对于桑树MITE转座子的研究只停留在简单的鉴定和分类上,具体系统深入的研究还没有报道。本文利用MITE-Hunter,MITEdigger和RSPB这三个软件对川桑基因组MITE转座子进行全面鉴定,并对鉴定到的MITE转座子进行了系统的超家族和家族分类。通过生物信息学的方法,对MITE转座子的扩增模式、插入偏好性、衍生小RNA以及与选择性剪接相关性进行了分析。利用PCR和转基因的方法,对MITE转座子引起的基因组多态性、MITE转座子的调控作用以及MITE转座子引起的选择性剪接进行了验证。通过甲基化组、转录组和小RNA组对模拟处理和灰霉菌处理的川桑叶片进行了联合分析。明确了基因和转座子在响应灰霉菌时的动态甲基化变化,并解析了这种动态甲基化的重要作用。本研究的主要结果如下:
1.川桑基因组中MITE的种类和含量
在川桑基因组中总共得到286122条MITE相关序列。MITE占川桑基因组的比列高达13.83%,超过了目前植物中基因组占比最高的水稻(10%)。根据TSD和TIR序列,将鉴定到的桑树MITE划分到PIF/Harbinger,Tc1/Mariner,Mutator和hAT四个超家族。四个已知的MITE超家族中Tc1/Mariner基因组占比最高(5.11 %)。
2.MITE在川桑基因组中的扩增模式及插入偏好性
通过对MITE各家族核苷酸差异度分析,有51个家族呈现出单峰分布,44个家族呈现双峰分布,剩下的家族呈现多峰分布或无峰平滑分布。进一步利用邻接法构建系统发育树发现,具有单峰分布的家族,其系统树呈现出明显的星状,没有明显的分支,表明这些家族的成员都是从同一个祖先经过快速扩增而来的。而具有双峰甚至多峰分布的家族,其系统树分为几个明显的分支,意味着这些家族在演化过程中,可能从祖先分化出了几个分支。为了进一步探索MITE的扩增,研究了不同倍性桑树资源中4个MITE的插入多态性。其中有两个MITE在所有桑树资源中都能检测到,表明这两个MITE在不同倍性桑树资源中被固定下来,而另外两个MITE在桑树染色体增多的过程中被激活。
为分析桑树MITE插入基因组位置的偏好性,首先对插入到基因序列(GS)和基因间序列(IS)的MITE进行统计,发现MITE整体呈线性均匀排布在基因组上。之后对每个MITE超家族在全基因组水平的分布及基因和上下游2k的分布进行了比较,发现除了Tc1/Mariner超家族,其他三个超家族都倾向于插入到基因附近。为了分析MITE伴随基因表达的比例,对插入基因外显子的MITE进行了统计,在MITE超家族中,PIF/Harbinger的表达率最高。有MITE插入的基因在五个组织中的表达比例分别为:花(1.65%)、芽(1.58%)、叶(1.58%)、皮(1.53%)和根(1.40%)。这些结果表明,在五个被分析的组织中,有MITE插入的基因表达比率是相对一致的。
3.MITE调控作用及对选择性剪接的影响
MnM2插入基因附近并在不同桑树资源中存在多态性,为进一步研究其是否具有调控作用,将其插入到MnANR基因附近并进行异源表达。结果显示,含有MnM2的转基因幼苗中MnANR表达水平显著高于不含有MnM2的转基因幼苗。
与MITE相关的选择性剪接在五种组织中的比例分别为:花(5.00%)、叶(4.26%)、根(4.02%)、皮(3.31%)和芽(2.58%)。五种组织中MITE在剪接位点的比例分别为:花(0.51%)、皮(0.50%)、芽(0.48%)、根(0.45%)和叶(0.43%)。为了进一步验证MITE对选择性剪接的影响,分析了三个桑树资源中的一个MnPR-4基因,该基因内含子包含一个MITE(MnP4),导致第二个外显子被选择性剪接。同时MnP4在不同桑树资源中存在多态性,MnP4缺失的桑树资源中MnPR-4选择性剪接也会缺失。
4.基因和转座子甲基化模式及差异甲基化
在全基因组中,模拟样品中mCG、mCHG和mCHH位点占总CG、CHG和CHH位点的平均百分比分别为35.5%、26.6%和37.9%,接种样品中mCG、mCHG和mCHH位点占总CG、CHG和CHH位点的平均百分比分别为33.8%、25.5%和40.7%。与模拟样品相比,接种样品的基因和转座子及其侧翼的胞嘧啶甲基化水平升高。mCG水平在基因体及其侧翼区域均较高,而mCHG和mCHH水平在基因体中较低,在基因侧翼区域较高。在转座子区域的mCG、mCHG和mCHH水平远高于侧翼区域。这表明DNA甲基化在桑树转座子沉默中起重要作用。MITE的甲基化模型与转座子甲基化模型一致,说明MITE在转座子甲基化中起主导作用。
对于基因启动子区域差异甲基化进行了分析,其中mCG、mCHG和mCHH分别有976(811个低差异甲基化)、1,003(774个低差异甲基化)和12,779(2,842个低差异甲基化)个差异甲基化。之后进一步对这些启动子存在差异甲基化的基因进行KEGG通路分析,KEGG通路分析显示,植物-病原体相互作用(87.50%低差异甲基化)是mCG差异甲基化的主要基因类别,碳代谢(73.68%低差异甲基化)是mCHG差异甲基化的主要基因类别,代谢(21.83%低差异甲基化)是mCHH差异甲基化的主要基因类别。这些结果表明,mCG和mCHG通过增强抗病和碳代谢相关基因的表达参与了对灰霉病的抵抗,而mCHH通过抑制代谢通路相关基因的表达参与了对灰霉病的抵抗。分析了CG、CHG和CHH差异甲基化在基因和转座子中的比例。差异甲基化在转座子中所占比例显著高于基因中,尤其是CHG和CHH中,CHH差异甲基化有63.59%分布在转座子中。进一步分析发现,差异甲基化主要分布在MITE转座子上。基因启动子区域影响转录调控,启动子甲基化程度的差异影响转录表达。在启动子区,CG、CHG和CHH差异甲基化发生在转座子上的比例分别为40.60%、43.13%和67.22%。启动子差异甲基化主要分布在MITE转座子上,这表明MITE在通过RdDM途径调控基因表达中发挥着重要作用。
5.桑树MnMET1的沉默增强了桑叶对灰霉病的抗性
利用病毒诱导基因沉默(VIGS)对MnMET1进行沉默,沉默MnMET1表达的植物对灰霉病菌的生长有明显的抑制,同时鉴定到一个抗性基因Morus002632在MnMET1沉默的植株中增强表达。这表明,MnMET1的沉默可以增强桑树抗性基因的表达,从而增强桑树对灰霉病的抗性。
本研究系统鉴定了桑树中MITE转座子,全面解析了MITE转座子在桑树中的功能,有助于进一步了解桑树基因组的进化。结合甲基化组、转录组和小RNA组联合分析,首次系统解析了转座子-基因-甲基化-灰霉菌之间的关系,明确了MITE转座子通过RdDM调控基因的重要性。