基于蛋白质一级域结构和二级结构的相互作用预测研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:cph2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质相互作用预测是分子生物学中一个重要的部分。蛋白质之间的相互作用是蛋白质功能方面最重要的特征,它在生物的生命活动中起着举足轻重的作用。在蛋白质相互作用的背后隐藏着域相互作用,域是组成蛋白质的功能片段,域相互作用对蛋白质的相互作用起着较为重要的作用,因此了解在域层面级别的蛋白质相互作用对研究蛋白质相互作用网络的构建起到举足轻重的作用;二级结构是构成蛋白质高级结构的重要部分,本文将把蛋白质的一级序列以及域结构结合起来,力图提高预测准确度,共同预测蛋白质之间的相互作用。鉴于传统的生物湿实验方法具有成本高、周期长、错误率高的特点,通过计算方法预测蛋白质相互作用的干实验方法得以快速发展,并已成为辅助湿实验方法共同获得蛋白质相互作用数据的重要手段。  本文在内容上主要分为以下几部分。  首先,主要介绍了本论文涉及到的相关的概念和原理,包括蛋白质的一、二级结构,蛋白质结构域的概念,期望最大化算法,相关方法,最大似然化方法以及支持向量机算法等基本概念。  其次,本文采用EM(estimationmaximum,期望最大化)算法和MLE(maximumlikelihoodestimate,最大似然估计)方法来预测采样蛋白质之间的相互作用关系。我们从蛋白质-域关系数据库PFAM[9]中提取蛋白质和其对应的作用域信息;同时还采用了其它的研究小组通过酵母杂交实验产生的啤酒酵母蛋白质相互作用数据。蛋白质预测主要分为三个步骤:首先,通过AM(associationmethod)方法来初始化域-域作用概率;然后,通过EM算法和MLE方法来训练域-域相互作用的概率;最后,用前面步骤训练得到的域-域作用概率值计算采样蛋白质之间作用概率。实验结果表明,我们的预测结果与从MIPS[25]数据库中获得的数据有明显的重叠。基因表达谱序的相关性验证表明我们的预测结果具有较高的准确性。  第三,我们在前一部分实验的结果基础上将蛋白质相互作用抽象成为多种特征的特征向量,用SVM(supportvectormachine,支持向量机)来训练模型,我们可以应用训练模型来预测未知的蛋白质对是否存在相互作用。这一部分涉及到支持向量的设计,反例集构造以及参数的选择等问题。最后,根据实验样本和生成的模型,构建了一个小型的蛋白质网络。  再次,介绍了本论文的各个实现算法的演示系统,包括:AM初始化,EM-MLE算法,SVM算法,MIPS和相关验证等实验。  最后,对蛋白质相互作用预测的前景进行了展望,探讨了该领域的进一步发展方向。
其他文献
数据挖掘是近年来数据库领域中出现的一个新兴研究热点,它是从数据库的大量数据中提取隐含的、未知的、具有潜在价值的信息和知识的过程。进行数据挖掘的方法有很多,基于粗糙
医疗卫生行业政策性强,专业性强,实践性强,要想成为医疗卫生报道领域的行家里手,最好的办法是与医护人员、病员交朋友.另外,多听医学学术讲座,将积累的素材及时剪贴成册,等等
信息科学和技术的快速发展,互联网、多媒体、移动设备存储和传输的数据迅猛增长使这个高度信息化的时代充满生机与活力。以计算机和互联网为代表的高新技术,不断应用在现实生
Internet正由传统意义下的信息发布平台逐渐演变为一个开放的分布计算环境,在开放的网络环境下实现跨组织的网络资源共享与应用集成已成为各个领域中具有广泛需求的基础性研
智能交通技术的快速发展使得用户对移动车载服务的需求越来越高,从而使得车载容迟网络(Vehicle Delay Tolerant Network,VDTN)日益受到工业界和学术界的重视。VDTN中车辆节点运行
随着网络技术和多媒体技术的飞速发展,如何保护多媒体信息的安全成为国际上研究的热门话题,数字水印技术应运而生。作为保护数字作品版权的一种重要手段,该技术已成为当今学
自动化人脸识别技术在国家安全、军事安全、公共安全和家庭娱乐等领域具有广泛的应用前景。虽然人类可以毫不费力地识别出人脸和表情,但是机器自动识别确是一个极具挑战的难
计算机技术的迅猛发展使得企业办公自动化水平逐步提高,而企业内部管理水平的发展速度往往滞后于企业的其他方面。因此,如何提高一家企业的信息化管理能力,协调其内部管理和外部
随着芯片技术、通信技术和传感技术的飞速发展,目前传感技术正迈入无线传感器网络新时代。这种网络由大量集成有传感器、数据处理单元和无线通信模块的微小节点组成,通过自组
随着图书文献资源数字化进程的不断推进,各高校图书馆、情报单位各种外购和自建的数据库越来越多,为了获取完整的数字资源,资源用户不得不花费大量的时间在各个资源系统的切