论文部分内容阅读
适应是生物进化的核心,在自然界中无处不在。大量基因组和群体多态性数据的出现,以及比较基因组学、生物信息学、群体遗传学、系统生物学的快速发展,为分子适应性进化机制的研究提供了基础和平台。而基因组时代的到来,新一代测序技术的应用,更是为研究适应性进化提供了前所未有的机遇。生物适应、物种形成、生命起源等生物学基本问题也将得到更深一步的探讨和解决。
本文分别从比较基因组学和群体基因组学两个方面入手,利用分子进化学方法探讨研究两个具体的问题:食物相关基因和人类骨骼基因的进化特征。通过对这些分子适应性进化实例的阐述,总结出在基因组时代利用分子进化学方法研究适应性进化的研究思路、基本策略,展望在基因组时代背景下,如何基于这些大规模基因组数据,利用各种生物信息学和进化基因组学方法探讨物种适应性进化的遗传基础。
具体,在第二篇中我们通过分析基因家族的分子进化发现,1):类胰蛋白酶丝氨酸蛋白酶基因家族在蚊子基因组中发生了显著的扩张。在蚊子吸血之后,该家族的基因表达水平显著升高,以那些发生了扩张的基因尤为突出。这些基因的扩张受到了正选择的作用,受选择的位点主要分布在与蛋白酶抑制剂相结合的区域。这些数据表明类胰蛋白酶丝氨酸蛋白酶对于蚊子的吸血特性的进化起到至关重要的作用,同时为研究和控制相关疾病提供了重要线索。2):六个基因家族(类胰蛋白酶丝氨酸蛋白酶、气味结合蛋白、嗅觉受体、味觉受体、细胞色素P450和谷胱甘肽-S-转移酶基因)的大小在12个果蝇基因组中存在显著相关性。考虑到这些基因家族中的很多基因在食物寻找、选择和消化过程中都起到重要作用,我们推测该六个基因家族由于食物的适应性在果蝇进化过程中发生了相关性进化。
同时在第三篇中,我们通过比较基因组学发掘到人类基因组中75个从头起源的蛋白编码新基因,起源速率达到每百万年约15个基因,此数目和速率远远超过以前的研究预测。然这些基因的功能和对应的表型性状仍不得而知,很可能是与人类大脑的快速进化是密切相关的,负责某些特异性状的进化。为进一步研究探索人类的一些特异性状进化的遗传机制,接下来在第四篇中,我们研究探讨了人类骨骼系统快速进化和高度表型多样性的遗传机制。我们通过查询大量文献,搜集到130余个骨骼发育基因,通过群体遗传分析发现骨骼基因在非洲和非洲外(欧洲和东亚)人群之间具有很高的群体分化,这些基因中含有显著多的高群体分化的SNPs,尤其是导致氨基酸改变的非同义SNPs。进一步分析表明这些ShiPs在非洲外人群中具有很高的衍生等位基因频率,而非洲人群没有。这说明在人类走出非洲之后,骨骼基因由于达尔文正选择的作用而发生快速进化。这就为人类骨骼系统的快速进化,以及现代人群表现出巨大的骨骼系统相关性状的多态性提供了遗传学证据。为进一步研究骨骼基因的进化,我们选取了BMP3、GDF5和SOST基因进行重测序,探讨在人类四个群体:非洲、欧洲、东亚、南亚中的进化特征。BMP3(Bone morphogenetic protein3)是其它骨形态形成蛋白(BMPs)的拮抗剂,在骨骼系统发育中起重要作用。我们发现该基因在人类群体中发生大量非同义突变,具有较低的遗传多样度,以及显著长区域单倍型同质性。这些现象表明BMP3基因在人类群体中受到达尔文正选择的作用。GDF5同样也是骨形态形成蛋白成员。我们发现该基因的5’端启动子区域在东亚人群中表现出正选择的特征,5’端的两个SNPs rs143383和rs143384的衍生等位基因很可能是正选择作用位点。而这两个SNPs的衍生等位基因是与身高呈负相关的,也就是说正选择作用导致身材矮小,因而我们针对这个看似不合常理的问题提出一个假说:在人类走出非洲之后的早期,由于食物匮乏,身材矮小的个体的生存几率可能更大。SOST基因编码的Sclerostin蛋白,是骨形态形成蛋白的抑制物。系统发育分析发现SOST进化过程中发生的非同义替代主要发生在通向人类的进化支系上,人类和黑猩猩之间只有一个核苷酸替代,导致人类进化支系上发生一个氨基酸的改变:152 Ala→Glu。在人群中,SOST基因的启动子区域具有很高的遗传多样度,受到平衡选择的作用。该区域的一个多态性位点rs10534024(--/GGA)的GGA等位与骨密度的降低有关。由于骨密度过高,过低都会对人体产生不利,因而SOST基因的启动子区域受到平衡选择的作用可能是为了维持骨密度水平。