人类mRNA序列中翻译起始位点AUG的统计研究及识别

来源 :北京大学 | 被引量 : 0次 | 上传用户:ZZC9919
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,用统计方法进行基因预测越来越受到人们的关注.出现了很多基因预测软件,但是对于利用翻译起始位点前的序列来识别翻译起始密码子,尤其是寻找高等真核生物(人)的mRNA序列中的翻译起始位点,却一直没有能给出更精确的预测和识别.原因之一是基因序列具有很复杂的空间结构,加之生物体本身的各种机制十分复杂多变.另外,翻译起始位点前的信息十分微弱,找不出很强的统计特征,这也是一个重要的原因.在mRNA序列中,编码区的起始位点是蛋安酸的密码子AUG;但是蛋安酸在编码序列内部和在5不译区也经常出现,即AUG并不一定是ORF的起始标志.因此,有必要应用统计方法找到5端非编码区的末端.我们的研究是:在mRNA序列出现的多个AUG中,究竟哪一个是真正的翻译起始位点AUG呢,在它之前的序列是否有一定的统计特征,怎样描述这些特征以及如何运用这些特征进行未知基因的预测.由分子生物学中的知识,在mRNA序列的翻译起始位点AUG前可能存在某一区域,是类似于原核生物中的SD序列即核糖体结合位点,并且我们还知道mRNA序列二极结构的瓶胫结构会影响基因的翻译,此外,再由现有的一些知识,我们知道mRNA序列的编码区和非编码区,A、C、U、G的含量分布会有一些不同以及三联码的转移具有某种偏好性,我们分别对他们进行了研究.基于上述几方面的知识和特点,可将核糖体结合位点和编码区看做是不同的隐状态,因而我们认为用隐半马氏模型会在这个问题中发挥作用.然后,论述了隐半马氏模型的原理以及在实际应用中的结果.
其他文献
近些年来,基因序列测序的完成、大规模测定基因表达水平的基因芯片(Microarray)技术的出现和高性能计算机的使用使得用模拟计算的方法大规模的研究基因表达调控成为可能.一些
到现今为止,在非线性发展方程的同(异)宿轨方面所取得的研究结果是比较少的,而且绝大多数都只是证明其存在性.该文不仅从理论上证明了(1+1)维,(1+2)维以及其他一些非线性发展
学位
该文主要研究在不同计算模型下的几个优化问题,由这些结果,根据计算复杂性的一般理论,可得到相应问题的复杂性阶的估计.全文分为两部分,共七章.在第一部分(第一章至第四章)中
本文针对平面以及空间弹性体与接触问题,通过对自适应边界元法的改进提高计算效率和精度方面进行了详细讨论。 第1章为绪论部分,概述了边界元方法的发展以及自适应方法在边
测度熵从整体上给出了动力系统复杂程度的一种量度,而Lyapunov指数则在局部从几何角度给出动力系统对初值依赖的敏感程度的描述.这些量通过著名的Ruelle不等式、Pesin熵公式
素质教育形势下,新课改的核心环节是课堂改革,进行课堂模式改革,摈弃旧的教育观念,让课堂脱掉枯燥乏味,说教式的帽子,努力向受学生喜欢的课堂这一目标迈进,成为教师需要解决
该文主要讨论了一类具有Holling Ⅳ类功能性反应的非自治的捕食系统,利用Brouwer不动点定理和构造Liapunov函数的方法得到该系统永久持续性生存和存在唯一全局稳定的周期解的
随着时代的不断发展,教育事业也在蓬勃向上,人们越来越重视教育质量与精准,因此对教育的评价也一步步走向了成熟,对课堂的评价就是其重要的组成部分.但是我国现今的课堂评价
本文对以Borel测度为初值的一阶拟线性方程的BV解进行了研究。我们考虑形如下式的Cauchy问题,(б)u/(б)t+(б)um/(б)x=up,(x,t)∈QT=R×(0,T)(1)u(x,0)=μ(x),x∈R,(2)其中m>1,0<p≤