基于蛋白质序列信息预测二硫键的新方法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:dc365
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质(protein)是一切生命活动的物质基础,一切重要的生命现象与生理机能都与蛋白质息息相关,蛋白质组学是生物信息学一个重要研究分支,通过该分支的研究,人类可以更加深入了解生命过程的本质,从源头上对疾病的预防与治疗获得理论依据,进而提高人类生活质量,因此受到各国政府和众多学者重视。随着基因工程进入后基因组时代,蛋白质组学成为生物信息学主要的研究方向。作为由大量氨基酸通过复杂化学过程形成的生物大分子,蛋白质具有复杂的结构与功能,这些功能本质上由氨基酸残基通过不同结合方式与相互作用实现,二硫键作为维持蛋白质结构与功能稳定的蛋白质重要特征,其氧化状态与连接模式具有较大研究价值。近年来,蛋白质测序技术得到突飞猛进的发展,蛋白质数据呈现爆炸式增长,需要测定的二硫键数目也随之爆炸式增长,通过传统的生物学方法检测二硫键,不仅成本巨大,而且需要耗费大量时间,因此,通过智能算法快速而精确预测二硫键是当务之急,近年来,机器学习的方法已被广泛应用到二硫键预测中,仅就二硫键连接模式而言,不同的半胱氨酸对具有成键与非成键两种状态,这是典型的二分类问题。前人的实验研究大多通过特征提取,特征选择,并最终通过分类模型预测半胱氨酸的状态与连接模式。本文研究二硫键连接模式时,将特征分为氨基酸残基特征,半胱氨酸对特征与全局特征,通过将特征分组进行对比试验找到对预测最有利的特征集。在进行特征选择时,首先通过计算单个特征得分(包括方差得分,费舍得分,拉普拉斯得分)选择有代表性的特征,将这些特征进行相关性选择,将最终选择的特征利用多个不同的分类器进行二硫键连接模式的预测。与前人相比,本文在特征选择时进行了相关性选择。本文算法与数据集可在https://github.com/snep5021/Disulfidesprediction获取。
其他文献
云南省牛栏江流域天花板水电站调压井导井施工完成,并于日前开始了扩挖施工。天花板水电站位于云南省昭通市境内的牛栏江天花板峡谷处,为混合式开发水电站,引水系统沿牛栏江右岸
介绍了通辽市科尔沁区安监局通过全面深化改革,制定一系列安全生产监管方面的规定、决定和意见,初步形成了科尔沁区安全生产监管体制机制,为科尔沁区的经济社会发展提供了安
为了引导学生进行自主学习,提高学生自主学习能力,文章从两个方面提出了高中数学教学中引导学生自主学习的策略,即启发式导入,引导学生主动思考;开展自主学习,先学再教。
文章通过分析高职院校品牌专业建设的内涵与基本原则,体现品牌专业建设对高职院校提升教育质量的重要意义,继而又具体阐述了以“陶旅文化”为特色的高职电子商务品牌专业建设
2013年我国《商标法》进行了第三次修订。此次修订,明确了商标侵权损害赔偿方式的适用顺位,将权利人的实际损失作为商标侵权赔偿的首选赔偿方式。实际损失的赔偿方式,要求侵
文章就高校培育和践行社会主义核心价值观的具体途径进行了简单的论述,即把握学生动态,营造良好的校园氛围;打破应试教育,注重实践育人;加强师资建设,提升整体素质水平;重视
摘要:消费被喻为拉动经济增长的“三驾马车”,中国消费率的下滑对于我国经济增长十分不利。受中国传统观念影响,中国的储蓄率长期居于世界前列,远超世界平均储蓄率。相应的,中国消费率也处于世界低端水平。不敢花钱,低端消费等客观现实是导致中国消费率低的主要原因,当前消费率下滑也与2008年经济危机以及中国经济下行等经济环境有关。消费率的下滑会引致国民经济失衡等经济风险,需要相关部门提起重视。本文将结合中国消
文章主要介绍了汽车白车身的制造过程以及工位质量的概念,工位质量状态作为白车身质量输出稳定性的一个关键因素,是汽车白车身制造过程中需要特别关注的内容。