基于RNN及其融合方法的DNA甲基化预测模型研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:candyhaiyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA甲基化是表观遗传机制的一种,涉及多种重要的生命活动。研究DNA甲基化在基因表达调控、疾病防治、肿瘤识别等方面具有重要意义。利用实验手段检测DNA甲基化的方法可以获得较高的准确性,但由于成本高,并不能大规模的应用。因此,利用机器学习模型预测DNA甲基化成为实验手段的重要补充。近年来,随着深度学习技术的发展,研究人员开始使用深度学习框架进行DNA甲基化的研究,与传统的机器学习方法相比,深度学习可以更充分地利用现有的甲基化数据库,可以从大量的数据中自动学习到潜在的甲基化特征。目前,DeepCpG、MRCNN等基于深度学习的DNA甲基化预测模型取得了良好的效果,但还存在着难以提取DNA序列时序特征、部分区域性能较差的不足。针对以上问题,本文构建了三种通过局部DNA序列预测DNA甲基化的深度学习模型。相比于现有模型,提升了DNA甲基化的预测性能。具体工作如下:(1)针对于卷积神经网络(Convolutional Neural Networks,CNN)每层内部神经元相互独立,难以有效利用DNA序列时序信息的问题,文本基于循环神经网络(Recurrent Neural Network,RNN)在层之间的神经元存在权连接,对时序上的变化更为敏感的特点,构建了基于RNN的DNA甲基化预测模型。通过与MRCNN模型在相同数据集下的对比试验,本文RNN模型甲基化水平回归的均方误差下降到0.0361,甲基化状态分类的准确率提高到90.66%,并且RNN模型对低甲基化位点的预测准确率较高,这表明RNN模型提取的特征在研究低甲基化区域的甲基化模式时可以做出更大的贡献。(2)RNN模型在低甲基化区域有着较好的性能,但在高甲基化区域的性能却有所不足,为了弥补这种不足,并进一步提升模型的分类和回归性能。本文通过特征融合的方式,将在高甲基化区域有着良好性能的MRCNN模型融合到RNN模型中,构建了特征融合模型。经过训练之后的特征融合模型相比RNN模型和MRCNN模型在高低甲基化区域的性能都有所提升,取得了更好的预测效果,特征融合模型甲基化水平回归的均方误差减小到0.0305,甲基化状态分类准确率提升到91.72%。(3)特征融合模型在全基因组上的整体性能有所提升,但是相比于RNN模型,各区域的性能差异增大,并且在Intergenic和Open sea两个区域的预测性能还有所下降。针对于这个问题,本文提出将待测位点按DNA区域进行任务划分的多任务学习方法,并构建了共享-私有模式的多任务学习模型。通过私有模块提取各区域甲基化模式的私有特征,通过共享模块提取全基因组上甲基化模式的公有特征,并在每个任务中将私有特征和公有特征进行融合。通过多任务学习的方法,保留了不同区域甲基化模式的共性,减小了甲基化区域差异的影响,使模型各区域性能都有所提升,最终在全基因组上的甲基化水平回归均方误差减小到0.247,甲基化状态分类准确率提升到93.16%。
其他文献
传统汽车轮毂一般使用钢制材料,铝合金材质轮毂具有更轻的质量和散热快、坚固耐用及较长寿命等优点,非常符合当代汽车工业飞速发展的要求。然而铝合金轮毂的铸造工艺过程也存
铁凝的小说主题如同“多棱镜”,从整体看,集中了对女性、文化、人性各类主题的探索;从同一主题看,其言说方式呈现出“直面”与“迂回”共存的特征。在其文学想象世界中,兼具
随着国家监察体制改革的全面推进和《中华人民共和国监察法》的贯彻实施,改革开放以来逐步形成的职务犯罪侦查职能体系将从检察机关剥离,如何规范监察机关与检察机关在移送和
苏东剧变后捷克等中东欧国家的转型有很强的目标性,其转型进程以资本主义民主化和向西“回归欧洲”为导向,因此受到了欧盟很深的影响。它们在政治制度与社会法律等方面模仿西方,在经济贸易方面融入西方。与此同时,欧盟也推出一系列的经济援助措施,以便引导中东欧国家靠拢和加入欧盟。21世纪以来以捷克为代表的中东欧国家以加入欧盟为目标,在逐渐与欧盟市场制度趋同的同时对欧盟高度开放自己的商品市场、资本市场和金融体系。
目前,工业机器人正朝着轻量化、高精度和高效率等方向发展,机器人关节柔性带来的影响越来越明显,并且由于关节柔性的存在可能也会使关节的实际输出转角与理想转角之间产生一定的差异,从而对机器人的末端轨迹产生影响,导致机器人末端的抖动,因此对考虑关节柔性的动力学建模与振动控制是非常必要且有意义的。论文在国家自然科学基金面上项目(51675306)深圳市自然科学基金面上项目(JCYJ2019081217081
现行地方政府在国有企业公关形象,在很大程度上受到计划经济旧体制的影响,与社会主义市场经济的建立和发展需要有很多的不适应;在建立和发展社会主义市场经济的条件下,重塑地
巴尔蒂斯(Balthus)原名巴尔塔扎尔·克洛索夫斯基·德·罗拉(Balthasar Klossowski de Rola),是二十世纪法国的著名画家,一生致力于具象绘画。他的绘画题材涉及人物、风景、静物等,作品注重对光影的表现,但目的不是再现客观光影。他的绘画中,光通常表现为一种“集聚之光”,照射在画面主要人物上,形成强烈的光影效果。与传统绘画中的光影表现不同,巴尔蒂斯不刻意描绘光投射在物象上产
大气气溶胶作为低层大气的重要组成部分,在众多气侯现象中扮演重要角色。本文针对微脉冲激光雷达大气遥感探测展开研究,通过引入新型光电子器件,研制了一台米散射激光雷达系统,以南京北郊地区的气溶胶为研究对象,对大气能见度进行有效观测与研究。具体研究内容如下:1、从大气米散射原理出发,详细论述了气溶胶消光系数的反演方法,综合考虑系统便携性、造价成本以及整体性能等因素,设计并搭建了人眼安全的微脉冲激光雷达系统
真空紫外是一种新兴的挥发性有机物末端治理工艺,但是在工程应用中还有一些问题需要解决:1.真空紫外灯的利用率不高,运用真空紫外降解挥发性有机物的效率较低。2.真空紫外在不同工况下降解挥发性有机物的效率差异大,降解有机物的机理和降解途径的贡献率需要进一步研究。3.真空紫外设备设计不合理,工程应用差异巨大。因此,为了探究上述问题,本文进行了以下研究:1.选择挥发性有机物中典型苯系物(甲苯)作为目标污染物