基因组序列特征分析与可变剪接鉴定

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:A491858248
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究的内容涉及到生物信息学领域中基因组序列特征分析和建立可变剪接鉴定新算法两方面。 文章首先基于高质量RefSeq数据库,在较大数据规模下统计分析了人类及模式生物起始密码子旁侧序列所具有的“Kozak规则”,发现不同物种之间存在差别。同时分析了不同终止密码子旁侧序列的统计学特征,给出了相应的正则表达式。这对于确定cDNA开放阅读框架和预测基因组序列中的编码区非常重要。由于发现多种基因中存在同相位起始、终止密码子串联使用的情况,本文亦对此进行了讨论。 其次,DNA双螺旋作为遗传信息的携带者,可看作由A、C、G、T四个符号组成的线性字符串,通过计算从起始密码子到终止密码子之间编码区序列与内含子序列碱基概率分布的信息熵,证实了编码区序列与内含子序列具有不同的信息结构,为序列分类提供了一种新的信息学特征。 最后,在综合分析比较各类序列拼接算法及实现软件的基础上,结合课题特点,通过引入基因组序列作为参考坐标,利用基因组序列定位信息,构建剪接网络的方法,有效地减少了序列比对的次数,显著提高了计算效率。通过对MRPL55基因的计算,同时对比其它序列拼接程序结果,显示了本算法对可变剪接有较好的识别效果,为进一步的生物实验提供了重要的参考数据。
其他文献
学位
无线传感器网络在军事、医疗、环境等诸多领域有着广阔的应用前景,因而受到越来越多的关注。无线传感器网络中节点能量受限,因此延长网络的生命周期成为首要考虑的问题。在网络
本文针对一定时间段内多架飞机在双跑道机场降落的问题建立了相应的数学模型,对各种飞行状况下的请求着陆的飞机队列进行优化排序,以充分利用跑道容量。其次提出了将飞机分组排
  在过去数年间,人们对函数的单调插入问题进行了广泛的讨论。该问题的解决给出了对诸如可数仿紧空间,层空间等的函数刻画。受这些结论的启发,本文给出了对半层空间的几个函数
反转系统(Reversiblesystem)是继Hamiltonian系统之后在动力系统领域又一引起广泛关注的问题。问题之一就是在Hamiltonian系统中成立的著名的Nekhoro-shev估计能否推广到反转
本文的工作是Baker,Smith,Agentis等人的研究工作的发展。研究的目标函数有Cmax,∑Cj,Lmax,maxWjCj,∑WjCj以及maxVj。主要结果如下:定理1问题1‖∑Cj+maxW′iC′i是多项式时间可解
可转换债券是我国近年来引进的为数不多的西方金融创新产品之一。尤其是近几年,可转换债券在我国的发展十分迅速,已成为我国证券市场上一种重要的融资和投资工具之一。对其准确
随着我国科学技术的不断发展,网络安全问题日益突出,而目前网络安全问题的人才又特别匮乏.本文将分析网络安全问题发生的原因,指出网络安全专业相关的实践教学的必要性,探讨
本论文介绍了在乘积型差商空间中构造高精度、高稳定差分格式的一种新手段——组合差商法,以及该方法在抛物型方程中的具体应用和实现。最后对一绝对稳定的隐格式利用嵌套迭代
“三个代表”重要思想的本质是立党为公、执政为民。实现人民的愿望、满足人民的需要、维护人民的利益,是“三个代表”重要思想的根本出发点、落脚点,也是我们党全部工作的根