论文部分内容阅读
随着当前质谱技术的飞速发展,蛋白质组学研究进入了大规模数据收集与发现时代,在肿瘤分子分型、潜在生物标志物挖掘、重要通路生物大分子分析及药物靶点发现等方面发挥着重要作用。尿液是一种重要的生物体液,在液体活检、潜在疾病生物标志物发现中发挥着重要作用。与血液相比,尿液具有明显的优势,如获取更加方便、可无创、大量并随时获取,另外,尿液环境往往不受体内平衡调控限制,可以积累起机体内更大范围的变化,有助于生物标志物的发现。再者,三分之一的尿蛋白来源于血液,因此可一定程度上代表血液蛋白的变化情况。而从研究技术上来讲,尿液蛋白丰度的动态范围相对较小,相比血液可避免高丰度蛋白对低丰度蛋白鉴定的干扰。由上可见,尿液是寻找潜在疾病生物标志物的金矿,具有十分广阔的潜力,在临床研究中具有重要价值。
当前,尿蛋白质组学研究主要关注尿蛋白表达谱及其在不同生理病理及时间序列层次上的蛋白变化,着重构建尿蛋白浓度参考范围等,这些研究都将为未来对尿蛋白进行科研探索.、临床信息挖掘等提供前期基础。蛋白质组研究中的一项主要内容是蛋白翻译后修饰研究。翻译后修饰使蛋白在结构、功能等方面产生复杂的变化,使得蛋白呈现更精细、专一的生物调节能力。同时,由于翻译后修饰往往化学计量值更低,质谱碎裂行为更加复杂,在当前以生物质谱为主要技术手段的蛋白质组学研究中门槛较高。因此,尽管尿蛋白研究广泛,但对于尿蛋白翻译后修饰的报道非常有限。
磷酸化与糖基化是最为常见的蛋白质翻译后修饰,在生理及病理过程中发挥着重要作用。尽管如此,体液样本中的磷酸化修饰含量极低、稳定性差,质谱鉴定极为困难。而且,现有研究策略存在步骤繁琐、耗时长、自动化程度低等一系列局限。因此发展尿蛋白快速提取及简便的磷酸化肽段富集新方法,是推动尿蛋白磷酸化研究,探索其存在方式、生理及病理意义的关键步骤。
糖基化是另一类非常普遍的翻译后修饰,常见的糖基化包括N-糖基化及O-GalNAc糖基化。糖基化修饰可使得糖类与蛋白质这两种大分子协调作用,进而深刻的影响糖蛋白的结构与功能,调控糖蛋白在生理及病理条件下的各种生物进程。当前主流的以生物质谱为基础的蛋白糖基化研究方向是将糖链与肽段分开解析,分别进行糖基化位点的确认以及糖链组成分析。然而这类研究策略丢掉了蛋白与糖链的连接信息,无法反应糖基化修饰在体内的真实存在状态。因此,如果能同时得到糖肽序列、连接位点和糖链信息,将能为阐明糖基化修饰对蛋白结构及功能的影响提供更准确、全面的信息,能帮助生物学家更好的探索糖基化在生命过程中发挥的作用。然而,由于糖基转移酶及糖基水解酶的复杂调控,使得蛋白质糖基化存在显著的微观与宏观不均一性,复杂程度极高,而且完整糖肽亲水性强,质谱响应差,给糖基化研究带来巨大的困难。由于以上糖基化研究中质谱及数据分析方法的限制,对完整糖肽的研究虽已有文献报道,但仍存在如鉴定灵敏度和规模有限、数据解析耗时长、定量重现性差、缺失值严重等诸多技术瓶颈,亟待发展新型质谱分析和数据解析方法,推动本领域的发展。
基于此,本课题发展了一系列磷酸化及糖基化翻译后修饰研究的新方法,并将其应用到尿蛋白研究中。具体内容如下:
(1)建立了基于C4反相填料固相萃取的尿蛋白高效快速提取策略,利用联合酶切策略,并结合离心式二氧化钛富集装置进行磷酸化肽段富集,实现短时间内尿蛋白磷酸化肽段的快速富集与鉴定,为磷酸化尿蛋白质组研究提供了一套快捷、简便、高通量的研究新方案;将尿蛋白磷酸肽鉴定规模提高近20倍。
(2)建立了完整的N.糖肽非标定性、定量策略以及基于稳定同位素标记的二级定量方法,全面解析了EGFR蛋白13个N-糖基化位点上的糖型表达情况,并进一步开展了尿蛋白质组完整N.糖肽的深度定性定量研究;首创性提出了基于精确质荷比和色谱保留时间及糖型预测的完整N-糖肽一级质谱定性定量新策略,结合糖苷内切酶F去糖基化验证,实现了可靠的N-糖基化完整糖肽的高覆盖鉴定和定量,在78min质谱分析时间内鉴定到超过6000条高可信完整N-糖肽,极大地提高了蛋白质组学规模的完整N-糖肽的深度覆盖;针对核心岩藻糖修饰肽段的质谱碎裂及色谱保留时间特征,发展了基于峰形匹配的核心岩藻糖占有率分析新策略,并深入分析了尿蛋白糖基化修饰位点中核心岩藻糖糖型占有率。这一系列方法不仅在尿蛋白糖基化研究中发挥了重要作用,亦可在将来应用于其他类型生物样本的糖基化高覆盖分析及核心岩藻糖占有率研究,为潜在疾病生物标志挖掘,基于翻译后修饰进行的疾病分子分型、生物药糖基化表征等各相关领域研究提供有力支撑。
(3)建立了基于唾液酸特征碎片的O-GalNAc糖肽质谱谱图分类和数据快速检索新策略,在不损失糖型检索深度的前提下,实现了O-GalNAc糖肽的快速搜库,速度提高20倍以上,大幅提高了O-GalNAc糖肽数据解析的通量。进一步开发了不同样本间O-GalNAc糖肽色谱保留时间校正方法,利用已有的糖肽序列信息,通过质谱一级峰形匹配进行O-GalNAc糖基化缺失值填充,并对填充数据建立了一套严格的评价和质控标准,在36例健康人尿液样本中鉴定到超过1000条O-GalNAc完整糖肽,是当前最大规模的尿蛋白O-GalNAc完整糖肽数据集,并将定量缺失值降低30%以上。
综上,本文实现了对尿蛋白中磷酸化、N-糖基化、O-糖基化规模化分析新方法的开发与初步应用,鉴定出大量先前未知的蛋白质翻译后修饰位点,并在定量水平上进行了研究。此类方法可进一步拓展到血浆、细胞系及组织样本中,为蛋白组学中翻译后修饰的研究提供了新的思路与方法。
当前,尿蛋白质组学研究主要关注尿蛋白表达谱及其在不同生理病理及时间序列层次上的蛋白变化,着重构建尿蛋白浓度参考范围等,这些研究都将为未来对尿蛋白进行科研探索.、临床信息挖掘等提供前期基础。蛋白质组研究中的一项主要内容是蛋白翻译后修饰研究。翻译后修饰使蛋白在结构、功能等方面产生复杂的变化,使得蛋白呈现更精细、专一的生物调节能力。同时,由于翻译后修饰往往化学计量值更低,质谱碎裂行为更加复杂,在当前以生物质谱为主要技术手段的蛋白质组学研究中门槛较高。因此,尽管尿蛋白研究广泛,但对于尿蛋白翻译后修饰的报道非常有限。
磷酸化与糖基化是最为常见的蛋白质翻译后修饰,在生理及病理过程中发挥着重要作用。尽管如此,体液样本中的磷酸化修饰含量极低、稳定性差,质谱鉴定极为困难。而且,现有研究策略存在步骤繁琐、耗时长、自动化程度低等一系列局限。因此发展尿蛋白快速提取及简便的磷酸化肽段富集新方法,是推动尿蛋白磷酸化研究,探索其存在方式、生理及病理意义的关键步骤。
糖基化是另一类非常普遍的翻译后修饰,常见的糖基化包括N-糖基化及O-GalNAc糖基化。糖基化修饰可使得糖类与蛋白质这两种大分子协调作用,进而深刻的影响糖蛋白的结构与功能,调控糖蛋白在生理及病理条件下的各种生物进程。当前主流的以生物质谱为基础的蛋白糖基化研究方向是将糖链与肽段分开解析,分别进行糖基化位点的确认以及糖链组成分析。然而这类研究策略丢掉了蛋白与糖链的连接信息,无法反应糖基化修饰在体内的真实存在状态。因此,如果能同时得到糖肽序列、连接位点和糖链信息,将能为阐明糖基化修饰对蛋白结构及功能的影响提供更准确、全面的信息,能帮助生物学家更好的探索糖基化在生命过程中发挥的作用。然而,由于糖基转移酶及糖基水解酶的复杂调控,使得蛋白质糖基化存在显著的微观与宏观不均一性,复杂程度极高,而且完整糖肽亲水性强,质谱响应差,给糖基化研究带来巨大的困难。由于以上糖基化研究中质谱及数据分析方法的限制,对完整糖肽的研究虽已有文献报道,但仍存在如鉴定灵敏度和规模有限、数据解析耗时长、定量重现性差、缺失值严重等诸多技术瓶颈,亟待发展新型质谱分析和数据解析方法,推动本领域的发展。
基于此,本课题发展了一系列磷酸化及糖基化翻译后修饰研究的新方法,并将其应用到尿蛋白研究中。具体内容如下:
(1)建立了基于C4反相填料固相萃取的尿蛋白高效快速提取策略,利用联合酶切策略,并结合离心式二氧化钛富集装置进行磷酸化肽段富集,实现短时间内尿蛋白磷酸化肽段的快速富集与鉴定,为磷酸化尿蛋白质组研究提供了一套快捷、简便、高通量的研究新方案;将尿蛋白磷酸肽鉴定规模提高近20倍。
(2)建立了完整的N.糖肽非标定性、定量策略以及基于稳定同位素标记的二级定量方法,全面解析了EGFR蛋白13个N-糖基化位点上的糖型表达情况,并进一步开展了尿蛋白质组完整N.糖肽的深度定性定量研究;首创性提出了基于精确质荷比和色谱保留时间及糖型预测的完整N-糖肽一级质谱定性定量新策略,结合糖苷内切酶F去糖基化验证,实现了可靠的N-糖基化完整糖肽的高覆盖鉴定和定量,在78min质谱分析时间内鉴定到超过6000条高可信完整N-糖肽,极大地提高了蛋白质组学规模的完整N-糖肽的深度覆盖;针对核心岩藻糖修饰肽段的质谱碎裂及色谱保留时间特征,发展了基于峰形匹配的核心岩藻糖占有率分析新策略,并深入分析了尿蛋白糖基化修饰位点中核心岩藻糖糖型占有率。这一系列方法不仅在尿蛋白糖基化研究中发挥了重要作用,亦可在将来应用于其他类型生物样本的糖基化高覆盖分析及核心岩藻糖占有率研究,为潜在疾病生物标志挖掘,基于翻译后修饰进行的疾病分子分型、生物药糖基化表征等各相关领域研究提供有力支撑。
(3)建立了基于唾液酸特征碎片的O-GalNAc糖肽质谱谱图分类和数据快速检索新策略,在不损失糖型检索深度的前提下,实现了O-GalNAc糖肽的快速搜库,速度提高20倍以上,大幅提高了O-GalNAc糖肽数据解析的通量。进一步开发了不同样本间O-GalNAc糖肽色谱保留时间校正方法,利用已有的糖肽序列信息,通过质谱一级峰形匹配进行O-GalNAc糖基化缺失值填充,并对填充数据建立了一套严格的评价和质控标准,在36例健康人尿液样本中鉴定到超过1000条O-GalNAc完整糖肽,是当前最大规模的尿蛋白O-GalNAc完整糖肽数据集,并将定量缺失值降低30%以上。
综上,本文实现了对尿蛋白中磷酸化、N-糖基化、O-糖基化规模化分析新方法的开发与初步应用,鉴定出大量先前未知的蛋白质翻译后修饰位点,并在定量水平上进行了研究。此类方法可进一步拓展到血浆、细胞系及组织样本中,为蛋白组学中翻译后修饰的研究提供了新的思路与方法。