集成HCD与ETD串联质谱数据的肽段从头测序算法研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:RaymanL
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用串联质谱进行肽段和蛋白质鉴定已经成为蛋白质组学的核心技术。目前,基于串联质谱技术的蛋白质鉴定主要有两条技术路线:数据库搜索(Database Searching)和肽段从头测序(De novo Peptide Sequencing)。肽段从头测序是目前唯一不依赖蛋白质数据库直接从串联质谱数据推导出肽段的方法,但由于实验质谱碎裂信息不完整,肽段从头测序的精度和效率都不能满足实际需求。随着质谱技术的改进,现在的质谱仪能同时生成同一母离子的多种碎裂谱图,比如高能碰撞诱导裂解(Higher-Energy CollisionalDissociation,HCD)谱图和电子转移裂解(Electron transfer Dissociation,ETD)谱图,这些来自同一母离子的谱图具有高分辨率、高精度的互补碎裂信息。利用它们的优势,本文开发了一个新的算法pNovo+,它极大地提高了肽段从头测序的精度和速度。在数据库搜索验证的两个数据集上,pNovo+采用HCD与ETD互补谱图对正确鉴定了91.18%的谱图,同单独HCD(73.85%)和单独ETD(55.68%)的鉴定率相比有明显提高。pNovo+鉴定一张谱图或者谱图对在普通个人电脑上只需要0.018秒,比其他同类算法速度快10倍左右,主要是因为本文论证了反对称约束在高分辨率、高精度的质谱数据中不再需要。在这种情况下,本文开发了有向无环图的高效前k长路径算法pDAG,时间复杂度为O(|E|*logd+k|V|*log-d)。此外,pNovo+考虑了HCD谱图的内部离子和ETD谱图的氢重排现象。总之,采用HCD与ETD谱图对的互补信息和高效的pDAG算法使得pNovo+成为一个优秀的肽段从头测序工具。
其他文献
传感器接口的多样性及复杂性严重阻碍了物联网的进一步发展。其中,传感器输出电气信号种类繁多,且特性参数不明确,表述没有统一规范,导致应用系统硬件集成成本高,维护、扩展困难;而
人类迈入信息时代之后,诸如数字通信,数字多媒体,电子商务,搜索引擎,数字图书馆,天气预报,地质勘探,科学研究等海量数据型应用的涌现,各种信息呈现爆炸式的增长趋势,存储成为
随着工艺尺寸的减小,现代集成电路仍然按照摩尔定律不断发展,设计规模越来越大,复杂度越来越高,特别是在处理器设计领域集中体现了这一规律。更高的集成度使处理器体积变得更
从视觉感知的角度来看,计算机图形学的一个非常重要的目的就是对客观目标进行高效的图形表达,使其能够被人们有效地认知并快速理解。其中,光照计算是最核心的技术之一,其目标是对
GIS(Geographic Information System)作为处理地理空间信息的新技术于二十世纪六十年代兴起,近年来伴随计算机技术的飞速发展,该技术也得到了迅猛发展。其方便快捷的数据采集与
神经系统疾病是一种严重影响人类生命和生活质量的常见疾病,如心脑血管疾病已经成为我国国民的第一位死亡原因。这些神经系统疾病引起的后遗症,即使使用目前最先进、完善的治疗
目前基于3D颅骨进行面貌复原或面貌重构的技术在刑事侦查、考古学等领域有非常广泛的应用前景,其中如何评价颅面复原结果一直是此领域公开的难题。三维面貌相似度评价方法可
随着移动互联网的飞速发展,移动应用(Mobile Application,简称App)得到人们越来越多的使用。面对日益增多的App,用户更加依赖于分发工具—App商店。App商店为了改善用户体验,提供了
互联网作为当今社会最重要的信息基础设施,极大提高了人类社会生产以及生活的效率,但互联网的不可信因素降低了互联网作为基础设施的应用价值。为解决这样的问题,有学者提出对当
三维增强绘制是一种关注于信息表达的绘制方式,强调对物体表面特征的增强,例如物体的表面细节、明暗对比度、高光等,突出真实场景的某些显著信息,从而生成更清晰、更易于理解的绘