【摘 要】
:
蛋白质模式识别是后基因组时代生命科学中最重大的研究课题之一,蛋白质温热性识别和蛋白质亚细胞定位则是蛋白质模式识别研究中两个新兴的富有挑战性的问题。本文基于蛋白质结
论文部分内容阅读
蛋白质模式识别是后基因组时代生命科学中最重大的研究课题之一,蛋白质温热性识别和蛋白质亚细胞定位则是蛋白质模式识别研究中两个新兴的富有挑战性的问题。本文基于蛋白质结构与其功能的联系,从蛋白质的氨基酸序列出发,提出了基于序列前后组分与关联的特征提取方法,并采用支持向量机方法进行预测,取得了较理想的预测精度。本研究不仅对理解蛋白质结构与功能关系具有一定的理论价值,更对生物制药业、农业生物科技等多个应用领域具有直接或者间接的指导作用。
结论如下:
首先为绪论。该章综合介绍蛋白质温热性和亚细胞定位的研究背景、发展现状等,并简述新近迅速发展起来的机器学习方法——支持向量机。
其次为蛋白质温热性识别研究。本研究中,采用基于氨基酸组分和关联特征提取的新思路与方法,利用支持向量机对76对常温蛋白和嗜热蛋白训练后建模,再利用独立测试法对供检验的20对常温蛋白和嗜热蛋白进行模式识别预测。结果显示,支持向量机对常温蛋白和嗜热蛋白预测精度分别为85%、80%,相较于张光亚等研究人员运用的主成分分析法、偏最小二乘法、神经网络法中最优预测精度稍提高。
最后为蛋白质亚细胞定位预测。同样采用基于氨基酸组分和关联特征提取方法和支持向量机,对996条共分为三类的(cytoplasmic,extracellular,periplasmic)原核生物数据集训练后建模。结果表明,运用“留一法”和“十次交叉法”测试的预测精度分别达到93.57%和93.47%,与目前已知最好的预测结果相比有了一定幅度的提升。
其他文献
觅食策略是觅食生态学研究的主要内容之一,而食谱组成和行为时间分配是觅食策略研究的主要内容。食谱组成影响动物觅食行为,进而影响其他各类型行为时间分配。而动物行为时间
摘要:本文对板块模型展开了归类分析,希望能给我们的教学带来帮助。 关键词:物理教学;板块模型;归类分析 中图分类号:G633.7 文献标识码:A 文章编号:1992-7711(2017)08-0124 板块模型是高中物理中最常见最经典的力学模型,通常要涉及力学中几乎所有重要的知识点:物体的受力分析、运动分析、运动学规律、牛顿运动定律、临界问题、动量定理、动量守恒定律、能量守恒定律等。综合性强
煤矿作为一种能源矿产,在为经济发展、社会生产提供物质基础并且带来社会财富的同时,也带来了一系列环境问题,甚至影响人们的日常工作生活。而随着采煤程度的加大,大面积的塌陷区
从一道课本复习题引发对练习不同表现形式的教学探索,引导学生去发现,进而掌握本质,在获得成功的同时,激发学生的学习兴趣,促使各个层次的学生都能得到一定的发展.
盆腔炎(pelvic inflammatory disease,PID)是女性内生殖器及其周围的结缔组织、盆腔腹膜炎症的总称,包括子宫内膜炎、输卵管卵巢炎、盆腔腹膜炎、盆腔结缔组织炎以及盆腔脓肿
大鼠睾丸间质细胞主要分布在生精小管间的结缔组织中,约占睾丸重量的2%,但分泌的睾酮却占睾酮总量的95%。间质细胞的主要功能是合成和分泌睾酮,以调节生精作用、雄性第二性征和全
摘要:如何提升教师的幸福感已是很多教育工作者的一大困惑。教师的职业幸福感是实现教育本质的必然需要,教师能否从职业中获得幸福感,将影响教师的人生质量和学生的健康成长。 关键词:教师;幸福感;职业 中图分类号:G632.0 文献标识码:A 文章编号:1992-7711(2017)08-0127 教师能否从职业中获得幸福感,将影响教师的人生质量和学生的健康成长。唯有幸福的教师才能培养出幸福的学生。
摘要:中学化学“依量反应”问题涉及面广、综合性强、灵活性大,是高考的热点,也是中学化学教学的难点。本文对中学化学有关“依量反应”问题进行了系统的归纳、总结,并结合实例阐述了解决问题的方法和规律。 关键词:化学总复习;“依量反应”;教学 中图分类号:G633.8 文献标识码:A 文章编号:1992-7711(2017)08-0125 相同反应物因用量不同而发生的反应不同,因而产物也不同的反应,
基因lgl(lethal(2) giant larvae)作为果蝇肿瘤抑制基因(neoplastic tumor suppressor genes, nTSGs)的一员,在细胞极性与增殖调控中发挥重要的作用。已知lgl纯合突变体只能