论文部分内容阅读
叶绿体是植物进行光合作用的场所,是一种半自主复制的细胞器,拥有独立的遗传物质-叶绿体DNA(cpDNA)。从1986年首次获得烟草(Nicotianatabacum)(Shinozaki et al.,1986)和地钱(Marchantia polymorpha)(Ohyama et al.,1986)叶绿体基因组的完整序列以来,在NCBI数据库中已经公布完整叶绿体基因组的物种就达200多个。迄今关于叶绿体基因组的研究都是针对不同物种分别完成然后再进行物种间的比较,很少有研究在一个设计好的系统框架之下来进行比较基因组研究。一来是缺乏很好的研究框架的体系,再者就是测序成本较高。随着测序技术的提高和成本的降低,得益于叶绿体基因组数据库的迅速充实,使得开展叶绿体基因组的比较基因组学研究迅速发展。本研究选取被子植物中五大科之一的禾本科(Poaceae)四个关键亚科和稻亚科稻族(Oryzeae)为研究体系,在完成八个物种叶绿体全基因组测序基础上,开展了比较基因组学研究。主要结果如下:
⑴三种叶绿体基因组测序方法的比较。采用目前使用最多的三种方法(Fosmid文库构建后采用Shotgun测序、提取叶绿体DNA之后Solexa高通量测序和PCR直接扩增纯化后测序)完成叶绿体基因组的测序工作。不同方法在不同条件下各有优劣。采用构建Fosmid文库的方法前期工作量大,后续进行Shotgun测序费用也很高,但该方法得出的数据质量是最好的。采取提取纯化叶绿体DNA方法,要求实验材料很多,提取过程也很繁琐,不同提取方法效果也一样,我们采取高盐低pH方法就是一种很粗糙方法,进而采用新一代Solexa高通量测序,测序时间短,使用软件在进行序列的组装时,对参数设置敏感(如参考序列的选择),同时需要设计后续实验来完成序列的补洞操作,该过程因数据质量不同产生的实验量也不同。PCR直接扩增测序方法需要设计大量的引物来覆盖整个叶绿体基因组,实验工作量不小,同时由于叶绿体基因组的结构变化,其可用范围也很有限,但是如果在小范围内进行,一批引物可以完成很多物种的测序,是一种比较经济的选择。
⑵禾本科BEP分支的系统发育关系。以往的研究表明,禾本科内存在BEP和PACCMAD两个主要谱系分支。然而,BEP分支涉及的三个亚科类群(竹亚科Bambusoideae,稻亚科Ehrhartoideae和早熟禾亚科Pooideae)之间的系统发育关系一直存在争议。本研究采用叶绿体系统发育基因组学(chloroplast phylogenomics)的方法,详细分析了这三个亚科之间的系统发育关系。在排除了碱基序列组成差异、序列中碱基替代饱和差异、基因进化速率的差异等方面的因素之外,采用三种(MP、ML和Bayes)不同方法根据叶绿体全基因组信息进行了系统发育重建。结果表明,竹亚科Bambusoideae和早熟禾亚科Pooideae是一对姐妹类群,之后它们一起再与稻亚科Ehrhartoideae形成姊妹类群的关系,该结果得到了很强的统计支持,即稻亚科是BEP分支的基部类群。
⑶禾本科四亚科叶绿体基因组的变化。我们完成了竹亚科(Bambusoideae)1物种和稻亚科(Ehrhartoideae)7物种的叶绿体基因组测序工作,在此基础上结合已经公布的禾本科物种的叶绿体基因组,利用禾本科23个物种开展了叶绿体基因组的比较研究。结果表明:①禾本科物种叶绿体基因组之间共享相同的基因,叶绿体基因组序列具有很好的共线性;②禾本科物种的叶绿体基因组.AT%含量很高达61%,物种之间GC%含量变化一致,在各类基因之间的GC%分布也一致;③各个物种叶绿体基因组中30bp以上重复片段的分布不一致,重复片段的数目和基因组大小没有相关性;④禾本科物种之间叶绿体基因组大小变化是由于基因间隔区(IGS)序列的变化引起,IGS的长度变化在叶绿体基因组LSC、SSC和IR三个组分中变化趋势有差别;⑤叶绿体基因组四个连接区域长度的变化具有一定的系统发育信息;⑥叶绿体基因组间隔区域中插入/缺失(In-Del)的分布有一定的规律性,短片段In-Del占据绝大多数,其中单碱基变化占据了1/3的比例,在叶绿体基因组上LSC、SSC和IR三个组分中In-Del的变化也不一样。