与microRNA预测相关的最优特征子集识别方法研究

来源 :哈尔滨医科大学 | 被引量 : 0次 | 上传用户：guojinwenv1

【摘要】

：

MicroRNA(miRNA)是一类非编码的长度约为20-24个碱基的单链小分子RNA,是由具有茎环结构的约70-90个碱基大小的miRNA前体(pre-miRNAs)经过Dicer酶加工后生成,其在生物体的不同

【作者】

：

王丽美

【机构】

：

哈尔滨医科大学

【出处】

：

哈尔滨医科大学

【发表日期】

：

2010年期

【关键词】

：

MicroRNA前最优特征子集支持向量机识别方法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

MicroRNA(miRNA)是一类非编码的长度约为20-24个碱基的单链小分子RNA,是由具有茎环结构的约70-90个碱基大小的miRNA前体(pre-miRNAs)经过Dicer酶加工后生成,其在生物体的不同部位和不同发育阶段对基因的转录后调控都起重要的作用。　　目前,识别pre-miRNA主要有实验分析和计算分析两类方法。通过实验手段只能使部分高丰度表达的miRNA得到有效克隆,而大量低丰度表达的miRNA和组织特异性miRNA却难以发现,因此,近几年越来越多的研究倾向于利用计算生物学方法识别miRNA。迄今为止,已发展了许多算法与软件,如基于比较基因组学方法的软件miRscan、miRseeker、miRAlign等,这些程序都是通过序列保守性来预测pre-miRNAs,因此这类方法很难有效地发现物种间保守性较差或非保守的miRNA。鉴于实验手段和比较基因组学方法的局限性,研究者们开始将计算识别方法尤其机器学习方法应用于miRNA预测问题。　　计算识别pre-miRNA中,特征的选取至关重要,现有的研究中对pre-miRNA特征的选取各异,因此,如何更科学地确定一组最优特征来识别pre-miRNA成为需要深入探讨的问题。　　在我们的研究中,从miRBase13.0下载706个人类pre-miRNAs作为阳性集,阴性样本来自于Xue等研究中预处理后的8494个非pre-miRNA发卡序列,我们从中随机抽取706个作为阴性集。我们充分考虑pre-miRNA的一级序列特征和二级结构特征,共选取特征124个,基于R平台开发算法进行pre-miRNA的特征选择,运用遗传算法(Genetic Algorithm,GA)进行特征优化,用支持向量机(Support Vector Machine,SVM)作为分类器对真假pre-miRNA两类样本分类,提取出最优特征子集。　　接下来对提取的最优特征子集进行分析,取出高频出现的前20位特征深入探讨。并将此Top20特征作为候选,用逐步法挖掘出一些对分类贡献率高且组合效应强的特征组合,并进一步发现这些最优组合的规律性,这对miRNA的研究有着较为深远的意义。　　最后为了检验这些特征组合的预测效能,我们用挖掘的最优组合来预测miRBase14.0中新发现的人类pre-miRNAs共16个,每个组合的正确识别数都达到了13个以上,其中有6个组合达到14个,有1个组合达到15个,可见我们提取出来的特征组合有着很强的分类效能。

其他文献

铝酸钠溶液添加水合碳铝酸钙脱硅的研究

学位

铁水包单喷镁颗粒脱硫动力学模型

随着现代工业生产和科学技术的迅速发展,对钢材质量的要求日益提高,铁水预处理脱硫逐渐成为现代钢铁生产的重要环节。铁水镁脱硫因具有脱硫速度快、脱硫效率高、处理时间短、

学位

镁脱硫数值模拟流场温度场动力学模型

单个AcNPV病毒攻击SF9活细胞的超分辨实时跟踪

近年来，随着活体荧光标记蛋白的技术的不断成熟以及远场超分辨成像技术的不断发展，使得观测活体细胞内部的微小生理活动成为可能。　　本文通过生物活体荧光标记技术、物理荧

学位

超分辨成像技术SF9细胞AcNPV病毒单病毒实时跟踪

基于眼底视网膜图像的计算机辅助诊断

随着糖尿病发病率的不断增加,由此引发的糖尿病性视网膜病变已成为发达国家成年人致盲的主要因素之一。对眼底视网膜的定期筛查和及早治疗成为糖尿病患者预防失明的重要手段

学位

计算机辅助诊断眼底视网膜图像糖尿病性视网膜病变血管分割眼底损伤提取特异性眼底损伤

椎板和小关节切除对颈椎稳定性影响的研究

椎板及小关节切除是治疗椎管狭窄的常用治疗方法。颈椎是人体结构特征和运动特性比较复杂，同时也是最容易受到伤害的部分之一。颈椎的稳定性对于手术后的患者具有重大意义。　

学位

椎板切除小关节切除椎管狭窄颈椎稳定性

儿茶酚胺依赖多态性室速模型心肌细胞的钙信号时空动态及其分子调控

儿茶酚胺依赖多态性室速(catecholaminergic polymorphic ventriculartachycardia，CPVT)是一种由基因缺陷引起的心脏疾病。患者在安静状态下表现正常，但在情绪激动或剧烈运动之

学位

心肌细胞儿茶酚胺依赖多态性室速钙信号时空动态分子调控

大数据技术在城市轨道交通运营管理中的应用

随着我国国民经济的发展,城市轨道交通已经进入到大发展时期,国内城市轨道交通行业正迎来建设高峰,随着北京轨道交通快速上涨的运营里程,运营管理难度及维护工作压力也急骤增

期刊

大数据技术轨道交通运营管理

田径教学的问题及对策分析

随着我国教育体制改革的逐渐深入,体育课程也开始受到大家的重视和关注,各种体育项目应运而出,成为教练员开展体育教育的重要内容,通过有效的教育指导,促进学生体能素质的提

期刊

体育田径教学改革策略

新型类肝素多糖净化脂蛋白性能研究

本文分别以田菁胶、槐豆胶为主要原料制备了两种降解多糖磺化衍生物,并着重研究其清除血浆低密度脂蛋白(LDL)和纤维蛋白原(Fib)的性能,获得以下结论： 1)分别以田菁胶、槐豆

学位

肝素多糖槐豆胶田菁胶低密度脂蛋白净化肝素药物

并非概念惹的祸

20世纪中国雕塑几乎完全被西方式的雕塑取代。中国自己延续几千年的传统意义上的雕塑基本上销声匿迹,只有少量在民间流传。中国现当代雕塑是在一个国际化的语言背景下发展起

期刊

程曼刘开渠李金发语言背景国外留学民族文化背景照相写实主义艺术潮流立体主义可塑材料

与microRNA预测相关的最优特征子集识别方法研究

其他学术论文