论文部分内容阅读
基因在时间和空间上呈现不同的表达水平,所以不同生物体、同一生物体不同组织器官、同一器官不同细胞,同一细胞不同细胞器所拥有的表达基因都是不一样的。表达组的研究对象正是一个生物体在一定生理条件下的基因表达状态,它包括基因在转录水平上RNA种类和定量信息,也包括基因在翻译水平上蛋白质种类和定量信息。本研究系统地考察了睾丸组织和精子的表达组,试图从表达组学的角度出发回答涉及睾丸的两个问题。 Missing protein(MP)是国际染色体蛋白质组计划(Chromosome-Centric HumanProteome Project,CCHPP)提出的一个概念,即那些在人类基因组上注释为编码蛋白质的基因,而在人体样本中从未被任何检测手段所发现的一类蛋白质。如何阐明形成MPs的原因是近年来CCHPP研究的重点。我们以为,造成MPs的原因可能源于基因的组织或细胞表达的选择性或蛋白质检测的灵敏度限制,但是不大可能是由于基因注释错误所致。为了回答这一假设,我们需要找到一个富含基因表达的人体组织,最大程度地检测可能存在的蛋白质。已有充分的证据表明,睾丸组织在转录水平含有最多的组织特异“富集”表达基因,我们推断,它很可能含有最多组织特异“富集”表达的蛋白质,基于此,我们对三个人睾丸组织样品分别同时进行了RNA-seq和LC-MS/MS分析,试图从转录和蛋白水平全方位地评估睾丸组织的基因表达。 在转录水平,从每个睾丸中鉴定到约16000个蛋白质编码基因,三个样本之间的共享mRNA种类高达93%,且其丰度相关性为0.95。在蛋白质水平总共鉴定到9597个蛋白质,是目前最大的睾丸蛋白质组数据集。分析显示有638个睾丸蛋白没有相对应的mRNA信号;有7424个mRNA没有相应的蛋白产物;对于转录组和蛋白质组共同检测到的基因,其丰度相关性不到0.3,这些充分说明全方位评估基因表达水平的必要性。 在鉴定到的睾丸蛋白质组中含有403个MPs,相比其它组织,这些MPs对应的mRNA在睾丸组织中的表达丰度最高,是睾丸组织特异“富集”表达的基因。对其进行丰度比较分析发现在转录水平,MPs与睾丸组织中整体的基因表达丰度分布一致,然而在蛋白水平,MPs在睾丸组织中的丰度分布比整体的蛋白质丰度分布偏低,表明部分组织“富集”的基因仍然是低丰度蛋白,这的确给蛋白质的检测带来一定的困难。进一步的功能富集分析表明,MPs富集的功能均与睾丸组织生理功能特别是精子发育有关,说明MPs确具有组织功能特异性。 睾丸组织的主要功能是产生成熟的精子。精子发育过程涉及减数分裂,其分子调控机制例如DNA双链断裂起始的DNA修复和同源染色体的联会配对的调控一直是精子发生学研究之重点。过去的相关研究主要集中在精原细胞、粗线期细胞、圆形精子以及成熟精子这四类睾丸组织中含量较高的细胞;除了粗线期细胞,其他细胞对于减数分裂研究的贡献甚小。我们的合作实验室通过在小鼠生精小管里对精子发育进行同步化处理,在发生初级精母细胞减数分裂的时间段内对细胞进行连续收集并通过流式细胞仪分离富集到了处在各个减数分裂期的细胞。利用RNA-seq和LC-MS/MS技术,我们实验室对初级精母细胞发育过程的基因表达进行动力学跟踪,检测了细线期、偶线期、粗线期、双线期中的表达组,试图发现减数分裂阶段依赖性的基因表达,尤其是具有功能的蛋白质产物。 精子减数分裂转录组数据揭示:四个期所鉴定到的蛋白质编码基因数目基本接近(9000-11000),而且各个期单独鉴定的基因比率较小(3-5%)。可见,精子减数分裂Ⅰ前期四个阶段的细胞编码基因的转录呈相对稳定状态。转录水平总鉴定基因12954个,其中任意两个期间基因表达丰度显著差异两倍以上的基因有4162个;动态的蛋白质组数据揭示,四个期一共检测到5116个蛋白质,其中任意两个期间表达丰度显著差异1.5倍以上的蛋白有1460个。将这些差异蛋白质进行丰度变化趋势聚类以及功能富集分析,333个连续下调的蛋白质的功能与减数分裂性质无关,而在偶线期以后,连续上调的蛋白质与精子变形有关。表达组学的整合分析能够体现转录组和蛋白质组在精子减数分裂过程中的相关性和独特性:对于转录和翻译水平上都能检测到的4719个基因,它们在分裂过程中的丰度相关性很低(0.068),而且差异mRNA和差异蛋白质的丰度变化的相关性也比较低(0.02-0.41)。这提示减数分裂过程中,转录和翻译的调控遵循完全不同的分子机制。 本研究首次应用表达组技术对人体睾丸组织和减数分裂过程中的小鼠精子进行了系统分析,所获得的海量数据既充分体现了表达组分析的优势,同时也显示了整合不同表达水平的组学数据仍具有相当的困难性。深入发掘这些表达组数据,发展相应的合理聚类算法以及更多的实验分析是下一步工作的重点。