转录因子结合位点信息的提取、比较和分析

来源 :南京大学 | 被引量 : 0次 | 上传用户:weishaohua1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
真核基因的转录调控是基因表达调控最为关键的步骤,转录调控信息的提取和分析预测对理解复杂基因调控网络具有重要指导意义。基因转录调控主要是由转录因子承担的,它们通过结合到目标基因的启动子区域的特定序列(长度为5-25bp左右的保守序列)来提高或者抑制目标基因的mRNA表达水平,从而实现对目标基因在转录水平上的调控。不同转录因子由于它们的DNA结合域的差别,在和DNA结合时表达出不同的特异性。这种特异性可以通过一致序列(Consensus Sequence)或者矩阵(Matrix)来表示。矩阵相对于一致序列,可以更佳精确的对转录因子的结合特异性进行描述。目前有很多数据库收集了转录因子结合特异性的矩阵数据。本文的主要研究目的就是发展一系列的方法来收集这些矩阵数据并且开发运用这些矩阵数据在基因的启动子上对未知的转录因子结合位点进行预测的工具。我们同时发展了新的算法对这些矩阵数据进行比较和聚类分析。我们主要开发了以下的几个工具: ⑴本地数据集MORE(MOtif Retrieval):我们从Transfae Public 7.0和JASPAR数据库中下载了506个转录因子的信息,包括转录因子得名称,来源,结合的一致序列和矩阵数据。MORE的主要功能是:1)为使用者提供一个便利的查询转录因子信息的工具;2)为其它本地工具提供一致序列和矩阵的数据。 ⑵一致序列搜索工具FMSearch(Flexible Motif Search):我们在传统的一致序列搜索方法的基础上开发了新的基于一致序列的转录因子结合位点的预测工具。在搜索时,我们只考虑一致序列中较为保守的核心部分,并且对核心部分之间的非保守连接区域也赋予一定的灵活性。FMSearch相对于传统方法,搜索速度快,一定程度提高搜索的精确度,并且可以执行批量搜索的任务。 ⑶矩阵搜索工具MBMS(Matrix Based Motif Search)/PMSearch(Poly Matrix Search):由于矩阵对转录因子结合位点的描述更加精确,我们也在传统方法的基础上开发了基于矩阵的转录因子结合位点的预测工具MBMS。MBMS可以在输出结果中直观动态地显示阈值的变化对预测结果的影响。PMsearch则是一个web界面的预测工具,可以同时使用多个矩阵在DNA序列上进行预测。 ⑷矩阵比较工具MACO(Matrix Aligmnent and COmparison):我们开发了一种新的比对—计分相结合的方法来量化矩阵之间的距离。在这些距离数据的基础上,我们使用分级聚类的方法对506个矩阵进行了聚类分析。结果表明DNA结合特异性相似的转录因子往往具有相似的DNA结合域。使用者可以通过MACO来检索和输入的矩阵类似的矩阵以及对应的聚类信息。 ⑸在这些工具的基础上我们开始构建基因转录调控网络的分析平台。这个平台包括了四个主要单元:芯片处理单元、基因启动子处理单元、富集短序列的探测单元和转录因子匹配单元。这个平台将可以实现从芯片数据分析到转录调控网络解析的流程化运行。
其他文献
  特高压输电技术是当今世界电力技术的至高点,随着电压等级的提高,对输电线路的绝缘水平和安全性也提出了严峻的挑战。绝缘子是输配电设备中的重要元器件,它的可靠性直接
本研究通过对半知菌生物降解过程中木质素酶和纤维素酶的动力学及漆酶分子生物学的研究,取得如下进展: (1)应用固体发酵方法,研究了Alternaria sp.,Penicillum sp.,Cephalosporiu
随着数码技术的飞速发展和专业图像编辑软件的广泛使用,使得普通用户轻而易举的就能对数字图像进行伪造,从而颠覆了人们“眼见为实”的传统观念。这些对数字图像有意或者无意的
聚羟基脂肪酸酯(PHA)是一类具有生物可降解性、生物相容性及对环境友好的生物材料。通过相对简单的溶剂相分离技术将聚羟基脂肪酸酯(PHA)类生物材料制作成为新型纳米纤维结构
变电站是电力系统联系输电网和配电网的枢纽,是电力系统变换电压、接受和分配电能的重要环节。变电站的经济运行是降低电力系统网损,保证电网安全经济运行的重要途径之一,在整个
同源四倍体水稻结实率偏低是影响其在育种中直接应用的重要原因.对其结实率偏低的原因,前人虽有报道,但由于观察材料的数量有限,所以未能对同源四倍体水稻结实率低的生殖原因
随着人口的快速增长和城市的加速发展,城市化地区土地利用方式发生了巨大的改变。本文根据1988,1998和2003年南京地区TM影像资料,提取出农田、林地、水体、城镇、裸地5种土地利
油松毛虫(Dentrolimus tabulaeformis Tsai et Liu)属鳞翅目(Lepidoptera)枯叶蛾科(Lasiocampidae)松毛虫属(Dendrolimus),是我国北方森林危害最大的食叶害虫。以往对油松毛虫的
人重组粒细胞集落刺激因子(rhG—CSF)能够促进造血干细胞向中性粒细胞增殖、分化。还可动员成熟中性粒细胞从骨髓进入外周。rhG—CSF已经成为现今抗肿瘤化疗,放疗以及骨髓移植
随着人类社会的快速发展,带来了严重的能源危机和环境污染的问题,威胁着人类的生存。为了建设可持续发展型社会,以太阳能、风能、水能为代表的可再生清洁能源的发展最为迅速。我国太阳能资源丰富,光伏发电具有很大的发展前景,目前我国是世界上光伏发电装机容量最大的国家,但是光伏出力具有随机性、间歇性和波动性的特点,这给电力系统的调峰造成了很大的影响,严重限制了光伏发电在电力系统中的渗透率。为了更好地消纳光伏发电