论文部分内容阅读
DNA条形码技术在很多动物类群中应用并取得了良好结果,但植物中由于没有像动物DNA条形码中的通用标记(比如COI),寻找类似COI基因的通用标记或者为某一类群植物寻找特定标记成为急需解决的问题。目前,已用于木兰科植物系统发育分析的标记基本上都集中在较高分类等级上,由于木兰科中还存在一些问题,找到木兰科中叶绿体基因组中进化较快的区段可为分子系统学的进一步开展提供基础资料。基于此因,本文利用第二代测序技术(NGS)-Solexa测序测定了木兰科木兰亚科中国特有珍稀濒危种一焕镛木(Woonyougia septentrionalis)叶绿体基因组全序列,这是Solexa技术第一次应用在完整叶绿体基因组测序当中。主要结果如下:1.焕镛木(W.septentrionalis)叶绿体基因组的长度为159667 bp,和其他木兰分支或者其他典型陆生植物叶绿体基因组的结构一样,由四个部分组成:长度为88030 bp的大单拷贝区间(LSC),18669 bp的小单拷贝区间(SSC)和两个长度为26484 bp的反向重复序列(Ira和Irb)。整个叶绿体基因组共含有129个预测基因(predicted gene)。17个基因(4个RRN基因,7个tRNA基因和6个预测蛋白编码基因(包含ycf))在IR区重复(ycf1的部分序列在Irb重复),因此无重复的预测基因总数为112。这112个基因包括78个预测蛋白编码基因(包含ycf),4个RRN基因,30个tRNA基因。这与北美鹅掌楸(Lriodendron tulipifera)叶绿体基因组完全一样。焕镛木叶绿体基因组编码序列占56.67%。2.在对焕镛木和北美鹅掌楸基因编码区,内含子和基因间隔区进行比较,计算其P距离(P-distance)并参照DNA条形码标记筛选标准后得到了可被用作木兰科DNA条形码的一些标记,11个潜在最佳IGS候选区间:trnH-psbA,ndhF-rpl32,rpl32-trnL,trnD-trnY,accD-psaI,petA-psbJ,trnK-rps16,psbE-petL,trnT-psbD,trnE-trnT,psaI-ycf4;五个潜在候选基因:rpoA,rbcL,rps3,ccsA,matK,和一些内含子位点。其中trnH-psbA,ndhf-rpl32,rpl32-trnL,accD-psaI,petA-psbJ,trnK-rps16,psbE-petL,trnT-psbD等八个片段在Shaw等人的研究中也被发现。3.通过Msatfinder(on-line v.2.0)筛选得到了237个SSR标记(单核苷酸,双核苷酸,三核苷酸,四核苷酸,六核苷酸重复单元),在这237个标记中有86个单核苷酸简单序列重复位于单拷贝区间非编码位点且重复至少8次,且在单核苷酸重复序列中,大部分由A或者T组成。这为进一步研究木兰科植物种群遗传结构提供了基础资料。同时也发现了27对散布重复(dispersed repeat),其中24对在焕镛木和北美鹅掌楸中都存在。4.在对已报道的114个种子植物叶绿体基因组GC含量、长度和RNA编辑(RNA editing)频率相关性进行分析后发现RNA编辑频率和GC含量呈弱正相关,而且还和叶绿体基因组长度呈弱正相关关系,而GC含量与基因组长度之间没有相关性。