磷酸化蛋白质组数据整合及分析

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:zj280078064
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
真核生物中,蛋白质磷酸化作为最重要的、研究最广泛的翻译后修饰之一,参与调控了几乎所有的生物学过程。从生化的角度讲,磷酸化反应由蛋白激酶催化,通过将ATP上的磷酸基团与蛋白质共价连接,从而实现底物的磷酸化修饰。蛋白质磷酸化具有可逆性,去磷酸化过程由蛋白磷酸酶催化。真核生物体内的磷酸化修饰主要发生于丝氨酸(S)、苏氨酸(T)及酪氨酸(Y)残基上,目前研究认为,~30%真核生物蛋白存在磷酸化修饰,因此存在“海量”磷酸化位点有待鉴定。目前,基于质谱(MS)的高通量磷酸化蛋白质组学技术是最常见的大规模磷酸化位点鉴定手段,单次检测可鉴定上万的磷酸化位点。针对不断积累的磷酸化位点数据,如何系统地进行收集、整合及注释,如何快速高效地确定其上游调控激酶,以及如何在此基础上确定特定生物学过程中的关键磷酸化调控事件是蛋白质磷酸化领域亟待解决的问题。因此,本文围绕蛋白质磷酸化修饰开展了以磷酸化蛋白质组为对象的数据整合及分析。
  我们首先构建了真核磷酸化位点综合注释数据库EPSD。通过文献调研及数据库整合,EPSD对来自68个真核生物的磷酸化位点数据进行了收集,总位点数量达1,616,804,分别来自209,326个磷酸化蛋白质,同时整合的还有细胞或组织等来源信息。对包含定位概率(LP)信息的磷酸化位点,我们以LP分值表征位点的可信度并将位点分为4类。此外,EPSD对8种模式生物种的磷酸化底物进行了注释,注释信息来源于100个数据库及工具,覆盖15个不同的方面,进而实现磷酸化位点及其相应蛋白质的综合性注释。截至目前,EPSD是位点数目最多、注释信息覆盖度最全的真核磷酸化位点数据库。
  在此基础上,为实现磷酸化底物上游调控激酶的高效鉴定,基于本实验室开发的GPS算法,我们构建了新的激酶特异性磷酸化位点预测工具GPS5.0。经过新一轮数据收集后,GPS5.0的训练数据集包含15,194个磷酸化位点及其上游调控激酶信息。在此基础上,通过引入逻辑回归(LR)算法,将GPS2.1中的模体长度选择(MLS)及矩阵突变(MaM)策略分别更新为位置权重确定(PWD)及打分矩阵优化(SMO)策略,使得GPS5.0获得与其他工具相比相当或更佳的性能。此外,GPS5.0针对双特异性激酶分别构建了预测器。同时,在经典预测模块的基础上,GPS5.0引入了物种特异性模块,其预测范围覆盖了161个物种中的44,795个蛋白激酶。最后,通过本地软件的开发及在线预测网站的构建,GPS5.0实现了对实验学家的便捷使用。
  随后,针对非周期性生物学过程肝细胞癌(HCC),为建立其异常磷酸化事件与临床治疗间的关联,我们收集了19例HCC患者的术后癌组织及其中4位患者对应的癌旁组织,以及4种HCC细胞系,开展了LB定量磷酸化蛋白质组学的研究。最终共鉴定到了分布于9,061个磷酸化蛋白质上的49,933个磷酸化位点。针对上述磷酸化数据,我们开发了用于HCC可药用激酶组预测的整合分析流程iDruKin,共预测了16个可用于HCC治疗的潜在激酶靶标及其对应的药物。被预测激酶中不仅包括MTOR及CDK4/6等致癌激酶及其对应的抑制剂,同时也包含PKCs及AMPKs等肿瘤抑制激酶及其对应的激活剂。后续细胞、组织及小鼠实验结果证实了以MTOR及其对应药物雷帕霉素为代表的可药用激酶及其药物在HCC治疗中的潜力。同时,通过比较可药用激酶在不同预后患者中的活性变化,发现其对复发及不复发患者样本具有较好的区分度,提示被预测激酶组可作为HCC潜在的预后指标。
  同时,针对周期性生物学过程昼夜节律,我们采用模式生物黑腹果蝇作为研究对象,对持续黑暗条件下的野生型(WT)及per敲除型(per0)果蝇头部进行了2天间隔3小时的连续采样,并开展了TMT标记定量磷酸化蛋白质组学、定量蛋白质组学及定量转录组学的多组学研究。针对上述数据,我们开发了昼夜节律多组学整合分析流程iCMod,在不同组学层面分别鉴定了具有节律振荡的mRNA、蛋白质及磷酸化位点。通过比较发现,基因per的敲除对果蝇头部的节律产生了较大的干扰,消除了大部分原有的节律振荡。此外,基于WT型果蝇鉴定的校正后节律性磷酸化位点(NCPs),iCMod预测了27个可能的节律激酶,除已知的7个外,通过后续的实验验证,本研究最终新发现了3个节律激酶及3个有待进一步验证的潜在节律激酶。
  综上所述,本文围绕蛋白质磷酸化修饰开展了一系列研究。通过对真核磷酸化位点进行收集及多方面的综合性注释,构建了用户友好型数据库。在此基础上,构建了激酶特异性磷酸化位点预测工具,实现了对磷酸化底物上游调控激酶的预测。随后,针对非周期及周期性生物学过程分别开发了相应的磷酸化蛋白质组分析流程。
其他文献
脑血管疾病已成为世界上最主要的致残和致死的原因之一,而颈动脉粥样硬化伴随斑块的破裂是导致脑血管疾病的主要因素。大多数脑血管疾病的发生都是突发、没有先兆性。因此,监测颈动脉斑块的生长和萎缩并对斑块治疗效果进行评价具有非常重要的理论意义和临床应用价值。本文主要目的在于研究颈动脉斑块自动测量方法及斑块特征描述方法,以对斑块的生长萎缩进行监测以及对于药物治疗的效果进行评价。  在临床上,影像学是颈动脉粥样
学位
蛋白质的N-糖基化在细胞信号传导、受精、增殖和分化等生物过程中起重要作用,越来越多的研究表明N-聚糖与癌症、糖尿病和心力衰竭等许多疾病的发生与发展密切相关。N-聚糖的分析研究在对人类疾病的进一步理解和有效治疗等方面展现出巨大潜力。由于连接N-聚糖的微不均一性以及结构多样性,全面地研究N-聚糖的工作异常困难。应用于N-聚糖分析的方法主要有高效液相色谱(HPLC),毛细管电泳(CE),质谱(MS)和上
学位
丰富环境(enriched environment, EE)为大脑提供了多个方面的刺激,包括物理运动、多感官/认知刺激和社交性刺激等。在动物模型中,人们已经从行为学、解剖学、生理学、生物化学和分子水平上对EE暴露对大脑可塑性的影响进行了广泛的研究,发现EE暴露会导致功能上和结构上的神经可塑性,并且不同的EE暴露时间伴随着不同的认知过程,神经活动和可塑性的改变。此外,人们还对EE作为一个神经病学/精
学位
生物体是一个由多种具有特殊结构和功能的细胞组成的复杂有机体。对于研究生命体的结构与功能的成像技术而言,系统、全面、高分辨率的细胞形貌及亚细胞结构表征能力目前仍然是一个挑战。本论文对基于高频复合超声扫描探针显微镜(Atomic Force Acoustic Microscopy, AFAM)的无创高效亚细胞结构成像及其包含不同信息图像的融合方法进行了系统深入地研究,以期推动无创高效亚细胞成像及图像后
129Xe的原子核自旋极化度可通过自旋交换光泵技术提高四个数量级,被称之为超极化。超极化129Xe使肺部气体磁共振成像(MRI)成为可能。由于129Xe在肺内具有良好的溶解性以及对周围环境的化学位移敏感性,这使得129Xe气体MRI能够提供与肺部通气、微结构以及气体交换功能相关的丰富信息,而这些信息均无法使用当前的临床影像技术无创获得。近年来,越来越多的研究人员关注超极化129Xe磁共振(MR)技
学位
纳米金核酸试纸条生物传感器具有成本低,检测时间短(5~15min即可),用户友好,可肉眼观察结果和用于现场检测等优势,在多个检测领域有着巨大的潜力。  近年来,重金属污染事件和肝癌等癌症的发生日益增多,它们均严重地威胁人类的生活和健康。重金属Pb具有毒性强,累积性和不可逆性等特点,对人体的神经、肾脏和造血功能等造成严重的损害;肝细胞癌(HCC)是严重危害人类健康的恶性肿瘤之一,慢性乙肝病毒(HBV
终纹床核(the bed nucleus of the stria terminalis, BNST)是大脑中处理压力应激和奖赏的边缘前脑区域,具有高度异质性。BNST通过与多个脑区的功能连接,将外界的刺激信息和反馈的行为输出进行联系,以此参与生物体相关情绪(例如焦虑)的表达及调节。近年来,焦虑症作为一种常见的情绪障碍类精神疾病,对人类的身心健康已造成严重损害。啮齿类动物研究表明,BNST的不同亚
切片-体数据配准是脑部临床应用中一项关键的技术,属于二维-三维图像配准的一种。常用于脑部肿瘤变化检测、脑部放射治疗、脑部多模图像融合等,具有重要的研究意义与临床应用价值。然而,目前的切片-体数据配准方法,在脑部临床应用中还面临诸多挑战。首先,为了给医生提供更加全面的病变组织信息,需要将不同成像模态所反映的解剖、病理等信息进行配准,并进一步融合。其次,许多脑部临床应用无标志物存在,只能依赖医学影像实
糖基化作为生物体内最为广泛的翻译后修饰形式,它参与细胞黏附、细胞通讯、细胞增殖与分化等几乎所有重要的生理生化活动。免疫球蛋白G(IgG)在机体免疫和疾病诊断中作用重大,其糖基化的改变显著影响本身的结构与效应功能。结合高通量的基质辅助激光解析电离飞行时间质谱(MALDI-TOF-MS)以及高灵敏度的纳流液相色谱联用的电喷雾电离串联质谱(nanoLC-ESI-MS/MS),我们首次全面解析了IgGN-
学位
蛋白质磷酸化是由蛋白激酶催化,并将磷酸基团共价结合到底物蛋白质特定氨基酸残基上的过程。蛋白质磷酸化具有可逆性,去磷酸化则由蛋白磷酸酶催化。包含磷酸化蛋白质结合结构域的蛋白质,能够识别并结合底物蛋白质上特别的磷酸化位点,进而实现细胞内磷酸化信号的整合和传递。相分离或液-液相分离通过在真核细胞中产生无膜细胞器,进而在特定时空范围内,特异性调控各种生化反应的发生。相分离过程中涉及了许多蛋白质,且近年来的