论文部分内容阅读
节段式基因重复(SD,segmental duplication),又称低拷贝重复(LCR,lowcopy repeat),是指相似度大于90%,长度大于1kb的DNA片段,广泛存在于真核生物动植物基因组中。这些序列相似度高,常成簇排列在染色体的不稳定性区域,增加了基因组的复杂性,对基因组的组装是个重要挑战。研究表明,大片段重复与人类多种疾病及植物抗逆关系密切,并在人类基因组进化中起重要作用。 本研究采用全基因组鸟枪序列鉴定法(WSSD,whole genome shotgunsequences detection)和全基因组组装比较法(WGAC,whole genome analysiscomparison)对二穗短柄草Brachypodium distachyon)全基因组中SDs进行预测。基于测序深度(read-depth)的分析原理,利用WSSD法将109x的短reads比对到参考基因组上,共获得451个片段重复事件,覆盖基因组的7.582Mb,占基因组的2.78%。在SD区域共注释出304个基因,在细胞调控、信号转导、核酸结合等功能类型中富集,并对植物抗逆有重要作用。基于基因组组装的研究策略,利用WGAC法在二穗短柄草全基因组组装序列中鉴定出9559对SD的区域,其中,5.11%(13.854/271.14Mb)染色体内的重复;14.06%(38.12/271.14Mb)染色体间的重复。此外,1.77%(4.803/271.14Mb)的序列相似度在98%以上,表明大部分片段是近期重复事件的结果。 本研究对二穗短柄草中全基因组范围内的节段式基因重复进行了描述,对SD的含量、染色体组成及其相关功能基因进行了分析,为短柄草乃至整个禾本科的基因组进化分析及重要功能基因研究提供了有价值的信息。