论文部分内容阅读
原核生物和低等真核生物的基因组大小随着物种复杂度的升高而增加,但在高等真核生物中,不但基因组大小与物种复杂度的关系不成比例,而且其基因数量也远低于预期。人类基因组中编码蛋白质基因的数量与线虫等低等生物相当,只有约20000个。因此,高等真核生物采用了多种方法来增加基因表达产物的多样性,以保证其各项生物学过程正常有序进行,这其中就包括利用多个转录起始位点调控基因的表达,同一个基因采用不同的转录起始位点能生成具有不同5非翻译区(5UTR)的mRNA,调控其翻译效率,或者生成编码区截短的mRNA翻译产生氨基端截短的蛋白质。在本文的第一章中,我们对小鼠精子发生过程中多转录起始位点的调控进行了研究。精子发生经历了从精原干细胞到成熟精子这一漫长而复杂的过程,其转录本复杂度非常高,但目前对于精子发生中多转录起始位点调控机制的研究和理解仍然很浅。我们首先建立了一种新的全基因组转录起始位点检测方法——TSS track,通过增加一组未用烟草酸焦磷酸酶(TAP)处理的对照样品,结合生物信息学方法滤除背景信号,实现了高信噪比的转录起始位点精确定位。我们利用TSS track方法对出生后10天和21天小鼠睾丸进行了全基因组转录起始位点谱的分析,结果显示在精子发生过程中表达的基因几乎一半以上都至少含有2个转录起始位点,在10天和21天都有表达的基因中有75%使用了不同转录起始位点。研究还发现大量转录起始位点分布在基因间区域,说明在精子发生过程中有一些尚未被发现的新基因参与其中。以上结果表明可变转录起始位点调控在小鼠精子发生过程中非常活跃,是一种极其重要的基因表达调控手段。 本文第二章内容是对CRISPR-Cas系统的优化研究。CRISPR-Cas(Clusteredregularly interspaced short palindromic repeats/CRISPR-associated protein)是细菌和古细菌中的获得性免疫系统,用来对抗病毒和外界DNA的入侵。在三类已知的CRISPR-Cas系统中,以CRISPR/Cas9为代表的Ⅱ型系统最为简单,只要通过改变sgRNA(single-guide RNA)序列就能够靶向基因组DNA上的不同位点,因此获得了广泛研究和应用,成为继锌指核酸酶(ZFN)技术和转录激活因子样效应物核酸酶(TALEN)技术之后一种新的对基因组进行高效精确编辑的技术。我们对CRISPR系统中sgRNA的表达载体进行了分析,发现sgRNA序列中的连续四个尿嘧啶核苷酸(U)序列会导致转录的提前终止,对sgRNA的表达存在非常强的抑制作用。我们分别对这四个U以及sgRNA序列二级结构中与之配对的碱基进行了突变,结果显著提升了全长sgRNA的表达量以及CRISPR/Cas9系统的基因敲除效率,具有一定的应用价值。