论文部分内容阅读
目前全世界现生裸子植物约900种(误差±5-10%),其物种数量不及种子植物的0.4%。松杉类植物多为重要森林树种,也是经济木材的重要来源。由于裸子植物基因组庞大,迄今仍没有一个物种的基因组序列被测定。通常植物基因组大小与基因家族的复杂程度有关,但绝大多数裸子植物都是二倍体,并且一些在被子植物中为单拷贝或低拷贝的核基因在裸子植物中通常形成低拷贝或多拷贝基因家族,说明裸子植物和被子植物的基因组进化方式是不同的。裸子植物通过什么方式进化出如此庞大的基因组和复杂的重复家族及其重复基因的进化式样和命运等问题至今还是研究的热点和难点。本文选择木质素合成途径中的关键酶4-香豆酸:辅酶A连接酶基因4CL,重建其在维管植物中的进化历史,并重点研究其在种子植物(尤其是裸子植物)中的进化式样和规律,探讨其重复基因的进化和功能分化的关系。
1.4CL基因的结构特征
本研究从裸子植物10个科、30个物种中扩增并克隆到49条4CL,基因序列,结合从各种数据库中获得的被子植物7个物种的28条4CL序列以及卷柏的8条4CL基因序列一起分析,发现不同类群间4CL基因内含子位置保守,但长度变异大。被子植物中ClassⅠ的所有拷贝均丢失了第三个内含子,可能源于被子植物祖先中的一次内含子丢失事件。裸子植物的4CL基因有6个外显子,第三和第四外显子的长度高度保守;ClassⅡ分支中广义柏科的所有拷贝均丢失了第一个内含子,推测在该科的祖先中发生了一次独立的内含子丢失事件。4CL基因家族的有效密码子数(ENC)分析结果显示:单子叶植物的平均ENC最低,仅约为35;裸子植物的平均ENC与真双子叶植物基本持平,约为52;蕨类植物卷柏的平均ENC为40,远低于除单子叶植物外的其它种子植物。
2.种子植物4CL基因的进化
系统发育分析表明种子植物的所有4CL基因拷贝聚为一支。在种子植物的共同祖先中,4CL基因发生了一次重复,单子叶植物保留了一种拷贝类型,其余种子植物保留了另一种拷贝类型,随后在各自类群至少又发生一次基因重复,产生两个亚支ClassⅠ和ClassⅡ,且二者的进化速率差异很大;同一类群不同拷贝类型间序列相似度远低于不同类群同种拷贝类型间序列相似度。4CL基因外显子区的同义替换率ds几乎是非同义替换率dN的六倍左右,推测该基因家族受到强烈的净化选择作用。ClassⅡ分支中除大豆外的其它所有种子植物均只保留一个拷贝,推测该拷贝类型可能以生与死的进化模式进化。RT-PCR结果显示ClassⅠ和ClassⅡ基因均能转录,可能分别参与木质素和类黄酮的生物合成。
我们通过PAML软件的CODEML模块比较了基因位点间以及并系同源基因间不同支系-位点所受的选择压力。Site模型分析结果显示维管植物4CL基因可能受到强烈的功能制约,但也可能含少量受正选择作用的位点。Branch-Site模型检测到被子植物的A-DⅠ、A-DⅡ和A-MⅡ均具有统计上显著的正选择位点,尤其是A-DⅡ和A-MⅡ分支上分别检测到显著的位点至少为8个和15个。ClassⅡ分支参与类黄酮代谢途径,推测该分支内的正选择位点与类黄酮的次生代谢途径表达调控和抗性有关。裸子植物的所有分支都未检测到统计上具有显著性的正选择位点,可能由于该类群在数亿年前分化的序列积累了大量近中性的碱基替换,在这样复杂的背景噪音下以现有模型很难鉴定出具有正选择作用的氨基酸位点。卷柏的SⅠ和SⅡ分支分别检测到了5个和3个统计上显著的正选择位点。SⅠ分支由染色体上不同位置的两组串联重复、共六个拷贝构成,拷贝间编码区序列相似度高,基因结构和内含子长度变异较大。卷柏的基因组很小(100Mbp),却进化出如此多的并系同源拷贝,这可能与其适应多变的陆生环境有关。FITMODEL分析检测到了少量选择作用发生改变的特异分支或位点,但绝大多数位点或分支仍受到强烈的净化选择作用;具有选择转换位点的分支多为树图的深层分支。