论文部分内容阅读
线粒体基因常作为进化分析如多样性评估、系统发育和谱系地理检验的首选分子标记。对线粒体基因及其基因组的研究也一直是生命科学领域的热点之一,有重要的理论和实践意义。蜥蜴,作为地球上广泛分布的爬行动物之一,由于相对有限的扩散能力和特殊的栖息地要求,通常具有较强的种群遗传结构,常被作为验证生物地理假设和探讨自然种群的演化过程的理想类群。本文我们以西北干旱荒漠区广泛分布的虫纹麻蜥(Eremias vermiculata)为研究对象,对其天山南北的代表个体线粒体基因组进行比较分析;以此筛选分子标记,进而利用谱系地理学(Phylogeography)和生态位模型(Ecological niche modeling)的理论和方法研究其种群分化和谱系地理格局,重建该种的演化历史,阐明其演化模式,深入了解天山的构造隆升、西北地区的荒漠化、更新世冰期-间冰期循环以及环境气候变化对该地区物种分布格局和历史动态的影响机制。此外,筛选部分核基因并进行初步的谱系地理学分析,期望能够为后续研究提供借鉴。主要研究结果如下: 1.虫纹麻蜥线粒体基因组对比分析 对天山以北的1号样品(吉木乃县,准噶尔盆地,标本号GUO3027)及天山以南的1号样品(若羌县,塔克拉玛干沙漠,标本号WGXG08403)的线粒体基因组进行测定分析,其GenBank登录号分别为KP981389、KP981388。结果发现这两个线粒体基因组中的基因数量、排列顺序与典型脊椎动物的线粒体基因组一致。两个基因线粒体基因组相比较结果表明,除控制区外,序列中有553个位点发生了变异,变异比例为3.59%。编码蛋白基因的起始密码子除了ND3基因外(GUO3027为ATG,WGXG08403为GTG),在其余基因中南北之间没有差异,对应基因的终止密码子均相同。与大多数脊椎动物相同,虫纹麻蜥的D-loop(控制区)位于tRNA-Phe与tRNA-Pro之间。从D-loop长度上对比,天山以北地区为4097bp,天山以南地区为4409bp。结构上对比,D-loop内发生了长片段的插入缺失现象,含有两类重复单元:第一类(TypeⅠ)长为55bp(5-TTTTGTCCACTTCTCACCCTATTTTCTCTACTTCACACGCCGCTTCTAGCGGCTT-3),第二类(TypeⅡ)长为56bp(5-TCTAGAACACAAACGAATTAACAAAGAACAATTC GTTTGTAATTTACCTAAGTTTC-3)。值得注意的是,在重复序列中所含的以上重复单元在个体内和个体间序列都存在少量变异。两条序列相比较,在第一部分重复区中GUO3027比WGXG08403多一个重复单元;在第二个重复区中GUO3027比WGXG08403少3个重复单元。重复单元内序列的多态性与重复单元数量的变化都可能具有潜在的分子标记价值。本研究能为其他物种的线粒体基因分析,特别是对长D-loop区的分析提供参考。同时,对编码蛋白基因序列分别进行对比,选择变异度适中,且易于扩增和测序的Cyt b基因和COI基因片段进行后续谱系地理研究。 2.基于线粒休DNA的虫纹麻蜥种群遗传分化与群体动态研究 通过PCR扩增和测定了69个样点,共456个个体的Cyt b基因序列(1143bp)和COI片段(660bp)。将两个基因进行合并分析(共1803bp),共鉴定识别200个单倍型。基于线粒体基因单倍型构建的BI,ML和MP树拓扑结构一致,得到四个有显著地理结构的支系,其中来自准噶尔盆地和阿拉善高原等地的样本(Phylogroup A)与来自吐鲁番-哈密盆地的样本(Phylogroup B)形成姐妹支系,来自敦煌盆地的样本(Phylogroup C)与来自塔里木盆地和焉耆盆地的样本(Phylogroup D)形成姐妹支系。这种谱系地理格局也得到了分子变异分析(AMOVA)和单倍型网络图分析(NETWORK)的支持。有趣的是,发现准噶尔盆地和阿拉善高原等地的样本间有共享单倍型,且共享的单倍型多为“较古老”(或祖先)类型,提示由于分化时间太短,它们之间可能有谱系不完全分选(incompletelineage sorting)。这些结果支持了天山、北山对其基因流的阻隔效应。 虫纹麻蜥各个支系的分化时间估算结果表明:四个支系(A,B,C,D)的共祖时间约为1.13Ma(95%CI,0.536-2.08)。准噶尔盆地-阿拉善高原与吐-哈盆地种群(A-B)的分化时间约为0.35Ma(95%CI,0.126-0.67Ma)。敦煌盆地与塔里木盆地支系(C-D)分化时间约为0.31Ma(95%CI,0.117-0.603Ma)。这些时间节点与天山、北山的隆升时间相符。准噶尔盆地-阿拉善高原支系(Phylogroup A)共祖时间约为0.0916Ma(95%CI,0.03-0.18Ma)。吐哈盆地支系(Phlogroup B)共祖时间约为0.18Ma(95%CI,0.06-0.345Ma)。敦煌盆地支系(Phylogroup C)共祖时间约为0.16Ma(95%CI,0.05-0.309Ma)。塔里木盆地支系(Phylogroup D)共祖时间约为0.12Ma(95%CI,0.04-0.23Ma)。 准噶尔盆地-阿拉善高原支系(Phylogroup A)、塔里木盆地支系(Phylogroup D)和敦煌盆地支系(Phylogroup C)的Tajimas D与Fus Fs均为极显著负值,说明不能拒绝该地区的虫纹麻蜥在历史上经历过扩张。失配分布分析(mismatch distributions)也支持准噶尔盆地-阿拉善高原支系虫纹麻蜥经历过扩张。贝叶斯轮廓图分析(Bayesian Skyline Plot)也显示出塔里木盆地支系约在0.04Ma至0.05Ma期间种群出现了快速的扩增,而吐哈盆地虫纹麻蜥从大约0.18Ma开始有效种群大小一直处于恒定状态。准噶尔盆地-阿拉善高原支系也在0.04至0.05Ma期间处于扩增状态。准噶尔盆地-阿拉善高原支系(Phylogroup A)、塔里木盆地支系(Phylogroup D)与吐哈盆地支系(Phlogroup B)在末次盛冰期(LGM)并未有效种群大小处于相对恒定状态。而敦煌盆地支系(Phylogroup C)有效种群大小在末次盛冰期处于增长过程。 对虫纹麻蜥不同气候历史时期的分布情况进行生态位模型分析,结果显示:在末次盛冰期(LGM)时期,虫纹麻蜥的分布区最广,包括了阿拉善高原绝大部分地区、河西走廊西北部分、整个库姆塔格沙漠、吐-哈盆地绝大部分、焉耆盆地绝大部分、准噶尔盆地西南部地区、巴里坤和伊吾北部地区、塔里木盆地东部中部及西部边缘部分、蒙古南部与中国接壤部分地区,东南方向上适生分布区到达宁夏西北少部分地区。而且,上述地区的大部分均具有较高适生性指数;在末次间冰期(LIG)时期,与LGM时期相比适合虫纹麻蜥分布的区域较小。其中在塔里木盆地中部和西部地区、吐哈盆地、焉耆盆地和阿拉善高原东北部地区适生区域在三个时期中范围最小。在巴里坤和伊吾北部地区和准噶尔盆地西南部地区适生区也较小。然而,该时期分布区向东南方向延伸,到达了如今的陕西省;现今的虫纹麻蜥模拟适生区与LGM时期的相比,在塔里木盆地中部西部地区和阿拉善高原东北部地区有较小的收缩。在塔里木盆地东部地区有较小扩张。在蒙古南部地区有小幅扩张。而在,罗布泊地区、焉耆盆地和吐哈盆地适合分布区明显减小。由此可见,群体历史动态分析和生态位模型分析都支持了GM扩张模型对耐干旱的虫纹麻蜥的适用性。 3.基于核基因的虫纹麻蜥谱系地理结构的初步分析 对虫纹麻蜥结蛋白样蛋白(Cingulin like1,CGNL1)、微管相关蛋白1A(Microtubule-associated protein1A,MAP1A)基因片段及纤维蛋白原β内含子7(β-fibrinogen intron7)进行扩增与分析。共筛选扩增了181个个体的CGNL1基因片段(812bp),139个个体的MAP1A基因片段(1695bp),55个个体的β-fibint7片段(608bp)。利用核基因分别构建单倍型网络图,结果并没有显示出明显谱系群(Phylogroup)结构。运用单倍型序列构建系统发育树也未能得到稳健的结果。这可能是由于相比线粒体基因,核基于更易出现不完全谱系分选现象,即各个支系间分化时间短的情况下,与线粒体基因相比,核基因替代速率较小,而有效种群更大,从而引起谱系不完全分选。