论文部分内容阅读
基因表达调控研究对揭示生命的奥秘具有重大意义,而mRNA转录起始调控是调控的基本控制点,也是最重要的一环,其实质是转录因子结合相应的调控元件,影响了RNA聚合酶的活性,从而影响了基因的转录水平.本文从基因组数据出发,致力于转录调控元件的搜索、发现以及相关调控信息的可视化方面的研究.在识别转录调控元件的研究中,本文以真核模式生物啤酒酵母为研究对象,选用MEME算法,检验了该算法在用于识别转录调控元件时的有效性和局限性,进而将该算法用来分析一些实验结果,包括分析由Devaux等实验发现的20个受PDR1/3调控的基因以及由Gasch等实验发现的未知转录因子的9个受控基因,结果从PDR1/3调控的20个基因的上游区域中,我们识别出了PDR1/3的结合位点(其中15个酵母启动子数据库中已有,另外5个没有).而对Gasch等发现的未知转录因子的受控基因的上游区域的分析中,我们发现这个未知转录因子的调控元件与MCB很相似,而MCB是转录因子MBP1的结合位点,因此,我们推测,这个未知的转录因子可能是MBP1或者某个与它具有相似结合特性的转录因子.在研究用已知的转录调控元件进行搜索的过程中,我们尝试了利用共有序列(Consensus)和位置频率矩阵(PFM)两种方法.在利用共有序列搜索时,我们选用了快速有效的字符串搜索算法——BM算法,结果发现BM算法用于搜索转录调控元件时,所有与调控元件的共有序列一致的位点序列均可以搜索到,但存在假阳性现象;在用位置频率矩阵方法进行转录结合位点的搜索时,我们发现,搜索的结果与"P值"的域值有关,一般取的域值足够高,位点基本可以完全搜索到,但同样存在假阳性现象.怎样解决这些问题,有待进一步研究.另外,我们在转录调控信息可视化方面也做了一些工作,其一是将转录因子结合位点表示成Logo图的形式,从Logo图中可以比较直观的观察转录因子结合位点上每个位置的保守程度及相应的字母;其二是将转录因子结合位点在每条序列中的相对位置可视化地表达出来.最后,本文在上述研究的基础上,实现了转录调控信息分析软件GTRIAnalysis,该软件具有转录调控元件的搜索、发现以及相关调控信息的可视化三个方面的功能.