长分子非编码RNA与疾病关联关系预测

来源 :河南大学 | 被引量 : 0次 | 上传用户:antony86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学(Bioinformatics)是生物学、计算机科学与应用数学等学科相互交叉而形成的一门新兴学科。它是通过对生物学实验数据进行获取,加工,采用合适的计算模型,对得到的数据结果进行存储、检索和分析,从而揭示出这些数据所蕴含的生物学意义。对生物信息方面的研究,有助于加速医学发展的进步,为临床试验提供大量的参考数据,因此具有十分重要的理论价值和现实意义。人类基因组中仅有1%到2%是负责蛋白质编码的基因,其余不编码蛋白质的RNA称之为非编码RNA(non-coding RNA,nc RNA)。研究发现,长分子非编码RNA在人类的生理变化和一些疾病产生中扮演了重要的角色,例如基因组的印记、细胞分化变异、免疫应对、肿瘤发生等。因此,开发出一个基于这些数据集的计算模型去预测长分子非编码RNA与疾病之间关联关系是非常必要的。近年来越来越多的计算模型被成功的应用于预测与疾病相关联的编码蛋白质的基因或者微RNA中,能够有效地促进人们对复杂疾病基础层面的认识,更有助于人们研制出治愈它们的药物。针对长分子非编码RNA与疾病关联关系的预测研究,本论文对基于网络的随机游走算法,及传统的K近邻算法进行了分析和改进并应用于lnc RNA-disease关联预测,主要工作如下:1.提出了基于异构网络的Lnc RNA-Disease预测方法,基于获取的的长分子非编码RNA相似性矩阵、疾病相似性矩阵和长分子非编码RNA与疾病的关联关系矩阵,在改进相似性矩阵的基础上构造一个异构网络,并应用随机游走算法预测lnc RNA-disease关联。留一交叉法实验结果表明,AUC值为0.9544,相对于仅在lnc RNA功能相似性网络上随机游走的预测算法,具有更好的结果。2.提出了基于二次K近邻算法的Lnc RNA-Disease预测方法,在原有的K近邻算法基础上进行扩展,可以增加已知节点的冗余度,从而就间接增大了数据集中结点的数量。在此基础上,提出了加权的二次K近邻算法,并将之应用到Lnc RNA-disease关联预测中。留一交叉法实验结果表明,AUC值为0.8685,与传统K近邻算法相对比,具有更好的结果。3.设计并构建了基于B/S架构的lnc RNA-disease在线数据查询网站。为了支持网络医学的发展,为lnc RNA-disease关联发现提供帮助。基于B/S架构,采用.NET+SQL模式构建了一个在线数据查询网站。该网站主要包括相关数据信息的查询、下载和在线添加新数据三个主要功能模块。相关系统测试表明,系统具有较好的稳定性。
其他文献
从今年起,湖南益阳市中等职业教育将连续三年扩招20%。
基层党支部是我们党组织在基层的桥头堡,是党密切联系群众的桥梁与纽带.在新形势下,如何发挥好这个桥头堡和纽带作用,更好地服务党员、服务群众?如何更好地实现党建工作和单
经济全球化趋势使我国技能型人才培养面临前所未有的紧迫感,科学技术的快速发展对劳动者综合素质提出了新的要求,产业结构与就业结构变化使劳动力跨行业流动性增加,对培训的
期刊
水资源严重短缺、用水浪费和水污染趋势随着工业化进程逐步加快,是当前新疆水资源问题的主要矛盾,解决矛盾的根本途径是建设节水型社会。节水型社会建设是一项需要长期坚持的工
当前高职思想道德修养课教学改革必须转变教学观念,以人为本,树立素质教育观.推进素质教育,不断创新教学内容,突出职业特色,改革教学方法,强化职业能力,提高学生的综合素质,以促进知识
为了保障变电站及电厂通信通道的稳定可靠,使站内光缆敷设做到技术先进、经济合理、安全适用以及便于维护。文章详细设计了光缆从门型构架引下、站内电缆沟敷设和光缆路径的
毕业设计环节是整个高职教学中的一个十分重要的环节.随着社会主义市场经济体制的完善和经济结构的战略性调整,社会各方面都对高等教育的人才培养尤其是高职教育提出了新的更
推导了底部框架-抗震墙房屋沿任意方向地震时,框架承担水平地震作用的计算公式,可用于斜交底部框架-抗震墙房屋二维分析各榀平面框架的水平地震作用。由于正交底部框架-抗震
水是人类赖以生存的无可替代的宝贵资源,是社会经济发展的物质基础。针对新疆用水利用率低和用水管理水平低的情况,笔者认为,发展节水灌溉是发展节水农业的有效途径;改进地面灌溉
本文对当前企业在发展中存在的企业组织结构问题进行了分析。同时,针对不同的阶段提出变革方案。