【摘 要】
:
真核生物的基因表达调控十分复杂,其过程包括了相对独立的转录和翻译两部分。转录是基因表达的第一步,而转录起始又是转录的第一步。因此,准确定位转录起始位点,有助于更好的
论文部分内容阅读
真核生物的基因表达调控十分复杂,其过程包括了相对独立的转录和翻译两部分。转录是基因表达的第一步,而转录起始又是转录的第一步。因此,准确定位转录起始位点,有助于更好的理解基因的表达调控机制。本文分别对核糖体蛋白基因和非核糖体蛋白基因的转录起始位点及其附近的碱基进行统计分析,并基于改进的位置特异性得分矩阵混合构建转录起始位点识别模型。
首先,以Zhang和Dietrich利用SAGE方法预测了转录起始位点的2207条酵母基因序列为基础,选取实验测试次数较多的转录起始位点进行统计特征分析。通过频率分析,确定各位点的字符长度。引入信息熵,对各位点保守性进行评估,确定转录起始位点的核心区域。其次,构建转录起始位点识别模型。本文采用改进的位置特异性得分矩阵混合模型。对位置特异性得分矩阵采用了非参数混合的方法,充分考虑构建模型中的每一个转录起始位点特征。对模型中的参数改变以往取固定的值的做法,采用了动态编程,选取使得识别效果最佳的参数。第三,通过敏感性,特异性,功效及相关系数对模型的识别能力进行评价。
结果表明,通过对模型的改进,能有效提高模型对转录起始位点的识别精度。核糖体蛋白基因和非核糖体蛋白基因在最优参数情况下,控制敏感性指标为85%时,模型的特异性指标能分别达到84.91%和91.97%,相对以往研究方法中的65%有了显著的提高。利用模型识别转录起始位点,可以为实验提供参考,达到指导实验的作用。当然,模型的识别能力离精确识别还有一段距离,准确的定位转录起始位点还需要更多的数理统计方法和生物实验的验证。
其他文献
本文研究Pucci算子M±λ,Λ:对于给定参数00,单调不减;在(-∞,0]上,f(t)=0.
通过比较原理我们将方程(0.0.1)正下解的存在性问题等价转化为正的径向解的存在性问题,证明了
本文主要研究了生物动力系统中的时滞格系统的行波解问题,讨论了三类具有典型实际背景的格方程的行波解存在性,最小波速问题,渐近波速问题以及渐近动力行为等.全文共分为四章
伴随知识经济时代的来临,我国职业教育的思想和理念也相应地发生了变化,“以服务为宗旨,以就业为导向”的职业教育研究已在理论和实践层面悄然展开.相关的课程理念、课程模式
灰色马尔可夫模型(GM-Markov模型)是将狄色系统和马尔可夫链系统进行组合的一种新的模型预测方法。该方法综合了狄色模型和马尔可夫链模型的优点,在实际应用中能够很好的描述
Bruck与Reilly对双单ω-半群进行了研究,给出了双单ω-半群的结构定理.本文类似于他们的研究方法,定义了双单Z-半群,并对其进行了研究.本文在第一章第二节中研究了一般的双单
本文研究了投影的扰动理论。基于奇异值分解,我们获得了正交投影和斜投影AA()MN的加法和乘法扰动界,其中A()MN是矩阵A的加权Moore-Penrose逆,M和N是两个Hermitian正定矩阵。
算子代数是现代数学的一个重要分支,为了探讨算子代数的结构,近年来国内外许多学者致力于研究算子代数上的映射,取得了丰富的成果,并且总结了许多的方法和技巧.本文将在已有结果
对目前脉冲微分方程组有界性研究成果及微分方程组部分变元有界性研究成果作了较全面的总结,提出了“双重有界问题”的研究方向。综合运用截断矩阵法,微分积分不等式方法,李
人工神经网络的应用领域十分广泛,其理论发展也十分迅速。BP网络继承了神经网络最精华的部分,是应用最广泛的神经网络模型。其结构简单,泛化能力、容错能力都比较强,在许多领