基于大规模质谱数据在人类蛋白质水平研究变异位点

被引量 : 0次 | 上传用户:wumingwuming2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类在基因组水平的变异,如基因突变和单核苷酸多态性(SNPs)已经证明了同表型变异包括疾病具有很强的相关性。高通量技术的应用已经确定人类基因组有数以百万计的遗传变异,编码区的变异有可能会影响其相对应氨基酸变化,此发生在氨基酸水平上的变异叫做单氨基酸多态性(SAPs)。虽然已有部分研究进行SAPs的全局识别,但只有很少的SAP被发现,这是由于质谱实验自身存在覆盖率低的缺陷并且鸟枪法蛋白质组学分析依赖于蛋白质参考变异数据库,而目前尚且不存在一个全面的人类蛋白质变异数据库。本篇文章中,我们首先构建了一个全面的人类变异数据库,数据是从八个相关数据库中收集来的,包括NCBI的dbSNP数据库,Ensembl变异数据库,癌症体细胞突变数据库(COSMIC), UniProt变异数据库,蛋白质突变数据库(PMD),HPMD(人类蛋白质突变数据库),数据库MSIPI和数据库MS-CanProVar;然后提出了一个基于大规模鸟枪法蛋白质组学质谱实验数据(11,113组实验)进行变异肽段以及相关蛋白质鉴定的工作流。通过上述方法分析,进行严格质控后我们检测到了24,358个变异肽(包括29,431个nsSNPs肽段以及24,813个突变肽段),映射到8,505个基因,提高了质谱实验谱图鉴定率。我们还构建了一个动态网站,存储我们鉴定到的所有变异以及其相关信息,并且对其谱图进行了相关展示,使读者可以直观了解此变异发生位点以及质量变化等多方面信息。对结果进行进一步分析发现,不同组织间变异差距较大,但存在一些共性变异,在较多组织中出现。我们同样发现芳香族氨基酸不易发生突变,这也与其结构稳定性相吻合。对于特异发生在癌症细胞系中的变异进行功能分析(GO和KEGG Pathway),也发现发生变异的蛋白质都富集到一些重要的通路中,表明蛋白质变异同表型变异包括癌症息息相关。我相信我们的蛋白变异数据库会为日后蛋白质水平变异检测提供丰富的资源。
其他文献
我国是一个农业大国,农村社会和经济的发展息息相关,党和国家提出社会主义新农村建设作为国家的重心是立足于现阶段国情的,本论文的内容就是围绕农村现状及障碍,总结理论,借
建设“绿色矿山”是矿山建设的一次革命。笔者在文章中就绿色矿山应达到的标准以及系统分析法在绿色矿山建设过程中的应用作了简单介绍和总结,以期对同行在今后的地质灾害评
[目的]使用1970~2013年时间序列数据,分析了低碳情景下我国煤炭、石油与可再生能源的消费替代。[方法与结果】单位根检验显示各变量是一阶单整I(1)。Johansen协整检验说明变量之
对C/S、B/S结构的特点进行了比较,提出了基于两种结构混合模式开发的煤矿安全管理信息系统设计方案。
矿井通风机监控系统有效地保障通风机的正常运行,针对监控系统中众多的传感器和执行器故障,BP神经网络对正常状态和故障状态分别进行训练,将得到的网络结构、权值和阈值进行
在中国封建男权社会中,男性作为社会主体、审美主体,以其地位权利的优越性,确立了他们理想中女性形象的标准——色和德。按照这个标准,在诗歌中塑造了一系列典型的女性形象,
油气运输主要依靠管道运输系统,影响管道运输安全的主要因素是管道腐蚀,其中防腐层失效、油气成分、温度等都与管道腐蚀相关,因此需要采取科学的防腐技术,确保管道系统的安全
目的:观察分析缺氧诱导因子‐1α(HIF‐1α)在子宫内膜异位症(简称内异症)患者子宫内膜细胞的表达及意义。方法:收集不同r‐A FS分期子宫内异症患者(内异症组,n=35)和同期子宫肌瘤患者(
本文通过教育叙事的研究方法,揭示以下三个方面的问题:首先,农村教师的师生观:师德为教师素养的灵魂,坚持学生的全面发展;其次,了解到学生对“好”教师的要求;最后,归纳民主型师生关系
"五岳寻仙不辞远,一生好入名山游"是李白亲和自然的人生总结。无论是得江山之助的亲和之兴,还是以自然为宗的独坐之趣,抑或是无江海而闲的丧我之心,其好入名山游的生态学意蕴的