蛋白质Beta折叠的分析与预测及生物信息工具开发

来源 :南开大学 | 被引量 : 0次 | 上传用户:qwaer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
β折叠是一种重要的蛋白质二级结构类型之一,也是影响蛋白质结构预测精度的主要因素之一。对β折叠结构的深入研究和精确预测能够在很大程度上提高蛋白质结构预测的准确率,并对蛋白质折叠和蛋白质设计研究有重要的推动作用。本文就重点对β折叠结构进行研究。研究使用来自PISCES服务器的一个数据集。在对数据进行前处理时,改造和完善了我们前期工作中构建的SheetsPair数据库,并将PISCES的数据集整合到SheetsPair数据库中,后续的研究就通过该数据库管理数据。对β折叠结构的研究,遵循从β股间氨基酸配对出发到β股肽链配对的路线。首先对β股间的氨基酸配对进行了统计分析。结果表明,股间氨基酸配对不是随机的,而从整体上表现出一种明显的配对亲和倾向。基于统计结果,还分别得到了平行折叠、反平行折叠和总体β折叠的反映氨基酸配对偏好性的相对频率矩阵,这些矩阵成为我们后续研究的基础。分析还发现疏水作用和二硫键是影响氨基酸配对的两种主要因素,此外尚有其他因素(如周围环境)可能也影响氨基酸配对。平行折叠和反平行折叠的氨基酸配对偏好性也不相同。然后基于计量多维尺度(MMDS)的方法,对氨基酸配对偏好性进行了分析。通过MMDS的方法,将相对频率矩阵中反映的氨基酸配对的主要特征以图形方式直观地展示出来。在平行折叠、反平行折叠和总体β折叠的MMDS图中都可以看到有一个明显的氨基酸聚集“核心”,位于“核心”的氨基酸主要是疏水性较强的氨基酸,说明了疏水作用在β折叠结构中的重要性。通过MMDS分析,也发现了平行折叠和反平行折叠的氨基酸配对亲和性的差异,这为今后开发预测区分平行折叠和反平行折叠的算法打下了基础。基于MMDS分析的结果,并结合分层聚类的方法,还提出了一种对20种氨基酸聚类降维的方式:总体上将20种氨基酸聚为5类最优,而单独考察平行折叠时聚为6类最优,单独考察反平行折叠时聚为4类最优。在前面对β股间氨基酸配对分析的基础上,下面考察β股肽链的配对和排列。从直观上讲,β股的配对排列至少应包括三个方面的研究内容:(1)确定配对关联,即确定组成β片层的各条β股的两两配对关系;(2)预测配对的两条β股的相对方向(平行或反平行);(3)确定配对的两条β股的相对位置。我们的研究就围绕这三个方面分别展开。首先重点考察了第(2)方面,即配对β股的相对方向(平行或反平行)。基于前面分析得到的氨基酸配对相对频率矩阵,分析了氨基酸配对与β股排列方向的关系。结果表明,股间氨基酸配对与β股的平行/反平行的排列方向具有十分显著的相关性,股间氨基酸的相互作用在β折叠形成的平行/反平行排列方向的确定上起到了重要的甚至是决定性的作用,而环境因素和其他不确定因素在这方面的影响较小。我们从这个结论出发,采用一种新的编码方式,并基于支持向量机(SVM)开发了一种预测β折叠平行/反平行排列方向的方法。结果表明,该方法可获得比较高的预测准确率(86.89%的准确率和0.7126的Matthew系数值)。在第(1)方面,对β股配对关联规律进行了初步研究,发现β折叠股配对关联较多地表现出一种邻近配对倾向(“先来先配”倾向)。在反平行折叠中,相邻β股的配对还有对氨基酸距离的较强偏好性;而在平行折叠中,这种偏好性较弱。在第(3)方面,发现组成β片层的β股肽链在两两配对排列时,其末端并不一定彼此对齐,而往往出现一定的“延伸末端”。通过对延伸末端的统计分析表明,配对部分的长度占延伸长度(延伸长度是配对部分长度与两端的延伸末端长度之和)的比例一般要超过25%,配对部分的长度占β折叠股长度的比例一般要超过40%。基于研究实践中摸索和积累的许多生物信息学研究经验,我们开发了一些软件或工具,可为包括β折叠在内的许多生物信息学研究带来便利。这些工具主要有:用于β折叠股间氨基酸配对可视化的StrandPairsViewer软件、用于生物大分子序列关系动态绘图和可视化分析的SRD软件、用于时间序列数据读取和展示的NRChart控件(ActiveX控件)、用于膜片钳数据前处理的PCDReader软件、用于长时程增强(LTP)实验数据文本转换的LTPConverter工具、用于日常生物信息通用纯文本处理的超级记事本软件等。其中对许多软件和工具都在其性能优化上做了大量工作(提高运行速度、减少占用内存等)。文中对软件的特点、主要功能、以及主要的程序设计技术、方法技巧等进行了介绍。
其他文献
目的:探讨大鼠脓毒性休克早期经不同液体(0.9%生理盐水、低分子右旋糖酐、清蛋白)复苏后不同时间(6h、12h、24h)的血清细胞因子(TNF-α、IL-6、IL-1β、IL-10、IL-4)表达水平
目的:通过分析西宁地区EICU102例MODS病人的病例资料,进一步探讨导致该病死亡的主要危险因素及病死率。方法:选取青海大学附属医院EICU病房2012~2014年间收治的MODS患者102例
残障人数在我国人口总量中的占比较高,不可小觑,尤其是在当前社会现代化建设中,如何能够维护残障人士的生活幸福,建立完善的社会制度十分关键。基于此,论文就单手残障人士生
目的:观察不同液体复苏策略对内毒素休克大鼠小肠基本电节律的影响。方法:清洁级SD大鼠60只,雌雄不拘,每组10只,用脂多糖内毒素注射建立大鼠内毒素休克模型,根据液体复苏方法不
以苯胺为单体,过硫酸铵为氧化剂,采用化学氧化聚合法在盐酸和磺基水杨酸混合溶液中制备了导电聚苯胺。通过XRD、SEM、FTIR等分析手段,对所得产物的结构进行研究,并探讨在相同聚合
本文以中国第十轮经济周期和上市公司所处的行业周期为背景,利用224家上市公司2 464个样本数据,实证检验了2000-2010年宏观经济环境和行业周期性对公司技术创新水平的影响。
【正】 《啖影集》乃清代贵州的一部志怪小说,作者范兴荣,字仲华,普安厅人,嘉庆戊辰恩科举人,历官湖北黄岗江夏等知县,后升武昌府同知。罢归后构书楼,藏书数百种,文章自娱,吸
目的通过品管圈(QCC)活动,降低脑梗死偏瘫患者良肢位摆放的错误率。方法开展QCC活动,包括确立活动主题、进行要因分析、设定目标、制订对策并实施,比较QCC活动前后脑梗死偏瘫患
随着我国人民生活水平的提高与教育改革的推进,研学旅行逐渐成为素质教育的重要组成部分,并得到了国家政策的支持。2013年初,国务院印发《国民旅游休闲纲要》,明确要求"逐步
今年第2期,我刊发表了著名文学评论家周政保《从文学的存在理由说起———兼论小说怎样才能赢得更多的读者》一文,配发了编后语并发起了“寻找文学存在的理由”的讨论。从第4
期刊