蛋白质—核酸的相互作用特征分析及DNA和RNA结合蛋白的预测研究

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:dfjixie2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质—核酸的相互作用与生物体内最基本的生命活动密切相关,例如:基因的转录和调控、DNA的复制和修复、DNA的重组和包装以及染色质和核糖体的形成等。这种能够与DNA/RNA相互作用的蛋白质称为DNA/RNA结合蛋白,它们对于研究疾病产生的原因和药物设计靶标至关重要。随着后基因组时代的发展和大规模基因组测序计划的实施,人类获得了越来越多的DNA/RNA结合蛋白的序列和部分蛋白质-DNA/RNA复合物结构数据。面对后基因组时代已有的海量蛋白质数据,首要的任务就是对其进行功能注释,然后才能开始进一步对生命本质的研究。由于蛋白质和核酸相互作用的机理仍未完全确定,采用生物信息学的方法去研究和分析已有的数据,并解释这一生物学现象的本质不失为有效的途径,如何从众多蛋白质数据中通过计算的手段识别能够与DNA/RNA结合的蛋白质为本文拟解决的关键核心问题。本文从生物信息学的角度出发,以蛋白质的序列信息为研究对象,采用机器学习的方法全面分析和考察不同种类的序列描述符,并分层次挖掘蛋白质的序列信息,以此建立高通量的预测DNA结合蛋白的模型。本方法对DNA结合蛋白模型的分类准确率达到0.940,马修斯相关系数(MCC)等于0.881,优于已报道的文献和方法。最后,我们将该方法用于RNA结合蛋白体系,进一步分析并总结RNA结合蛋白与DNA结合蛋白的异同。本文中,我们开发了一种全新的基于序列预测DNA/RNA-结合蛋白的方法。不仅为进一步通过计算研究蛋白质—核酸相互作用机理奠定了基础,还可作为实验研究的辅助手段,为分子生物学实验验证提供有益线索。此外,本文还开发了从不同尺度挖掘序列描述符的框架,为今后基于序列的蛋白质功能预测提供了参考和新的研究思路。
其他文献
金黄色葡萄球菌是引起细菌性食物中毒的重要病原菌之一,无论在发达国家还是在发展中国家,由金黄色葡萄球菌(金葡菌)引起的食物中毒在细菌性食物中毒中占有较大比例。金葡菌广
Agents联盟形成是分布人工智能DAI中一种重要的协作方法.本文简要分析了Agents联盟的结构、形式以及联盟结构问题的数学模型.对于可分解的任务,且子任务之间没有优先关系,Age
目的探讨不同剂量文拉法辛与阿戈美拉汀联合应用治疗难治性抑郁症的临床效果。方法选取2016年4月~2018年3月深圳市康宁医院情感障碍科收治的82例难治性抑郁症患者作为研究对
在大数据时代,企业电子档案资源不断丰富。2012年,中国联通建立了适用于本企业的数字档案馆,以在线归档方式接入文书、合同、会计等9大门类的电子档案。为保障来自不同数据源的
维吾尔民间故事中有多种多样的形象。这些形象凝结了广大人民群众的智慧与想象,其中关于仙女的故事占很重要的地位。笔者搜集、整理了关于仙女的57篇民间故事,对其中的仙女形
淮安市作为苏北重要的中心城市和区域交通枢纽,公共交通发展取得了明显成效。文章以实地抽样调查数据为依据,分析了淮安市居民交通出行方式及对低碳交通的认知程度。在此基础
汉文训读是古代东亚的一种文本注释现象,不仅流行于我国各民族文献解读中,还被朝鲜、越南、日本等周边国家广泛认同和使用。东亚各语言的母语者以本国文字对汉文读音和语法加
采用能量色散X射线荧光法测定石油产品中总硫的含量,选择在高浓度或低浓度的工作曲线下对样品进行检测,对在测定过程中引入的各项不确定度进行评定,各项不确定度以相对标准不
海难与灯塔说到世界航运发展史,不能不提灯塔。灯塔,就是位于海岸、港口或河道,引导船舶航行或指示危险区的一种固定航标。一般来说,灯塔所在地的水域,往往是航运中复杂和危
集合数据同化方法具有简洁概念化的公式和应用起来相对容易等优点,因此,它们获得了普及性的应用;近10年来集合数据同化方法已经得到了快速的发展。综述了包括集合卡尔曼滤波(EnKF