基于随机游走模型的长非编码RNA与疾病关联关系研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:huan2735
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
长非编码RNA(lncRNA)是一种长度超过200个核苷酸的nc RNA,在细胞增殖、细胞分化、表观遗传调控、基因组印记、染色体修饰等许多重要的生物学过程中发挥着不可替代的作用。lncRNA与人类疾病息息相关,但其背后的确切机制尚不清楚。nc RNA研究对于理解细胞生物学和疾病机制的重要性还是显而易见的。为了推动研究的积极发展,需要发现新的lncRNA-疾病关联关系。然而,lncRNA与疾病之间的关系大部分还有待证实,因为进行生物实验需要花费昂贵的费用和大量的时间。因此,许多研究者开始研究先进而有效的计算方法来识别lncRNA-疾病的关联关系,为生物实验的有效前进提供方向,从而节约人力和物力。为了获得更准确的相似性信息和构建更有效的网络模型,本文提出了基于线性邻域相似性和不平衡双随机游走的lncRNA-疾病关联预测方法(LDA-LNSUBRW)。主要内容如下:(1)研究相关的生物数据库,从数据库中下载建立本文模型所需要的数据集,包括lncRNA-疾病关联矩阵,lncRNA功能相似性矩阵和疾病语义相似性矩阵。首先,利用加权K近邻算法对数据集进行预处理,解决数据集的稀疏性问题所导致的模型预测性能不足。其次,利用线性邻域相似性方法构建新的lncRNA相似性矩阵和疾病相似性矩阵,从而获得更为准确的相似性信息。最后,基于lncRNA和疾病的网络拓扑结构的不同,它们各自子网中两个节点之间的距离应通过不同的游走步数来控制,本文提出了一种不平衡的双随机游走算法来补充lncRNA网络与疾病网络之间的潜在映射关系。(2)为了评估模型LDA-LNSUBRW的性能,利用留一交叉验证和五折交叉验证进行性能评估,得到的AUC值分别为0.8874和0.8632±0.0051。此外,为了进一步验证预测结果的准确性,针对预测结果中与肺癌、乳腺癌和骨肉瘤相关的lncRNA-疾病关联对进行案例分析。从是否在数据库中有记录信息、是否有文献验证信息这两个方面进行验证,结果表明本文预测方法在三种疾病中准确性均达到一个理想结果,预测结果较为可靠。(3)本文还提出了模型改进方向,使用顺序双随机游走算法替代基于线性邻域相似性和不平衡双随机游走预测模型中的不平衡双随机游走算法,从而得到新模型LDA-LNSSXRW。利用留一交叉验证和五折交叉验证对新模型进行性能评估,得到的AUC值分别为0.8819和0.8455±0.0053。虽然效果稍低于模型LDA-LNSUBRW,但随着未来整合更多的生物学信息,构建更为庞大的异构网络,在具体的生物计算问题下,LDA-LNSSXRW的表现或许会更加优异。
其他文献
Fe基非晶纳米晶合金因低的平均磁各向异性和磁致伸缩系数而具有优异的软磁性能。然而Fe基非晶纳米晶材料的磁导率随频率升高而迅速下降,无法满足电子元件实现高频化的需求,因此本文开展了不同热处理工艺对高频软磁性能的影响研究。本文采用常规氮气保护热处理、热等静压和磁场热处理等热处理技术研究不同退火温度对1K107系列非晶纳米晶合金的软磁性能进行改善。用X射线衍射仪、精密磁性元件测试仪和软磁交流设备测量了铁
2022北京冬奥会以各种形式将奥林匹克运动的关键词之一"可持续"带入公众与众多企业与组织视野中,更以卓有成效的管理和实践,推动着大型活动可持续性管理理念与实践在中国的普及。《2022年北京冬奥会和冬残奥会遗产战略计划》发布、《北京2022年冬奥会和冬残奥会低碳管理工作方案》发布、首次在奥会史上采用二氧化碳制冷剂、亮相马德里气候变化大会……2019年,2022北京冬奥会以各种形式将奥林匹克运动
期刊
MOBA类游戏作为电子竞技的重要分支近几年迅猛发展,作为全球最赚钱的免费游戏,它的收入来源主要源于购买皮肤等内购行为。游戏内的角色视觉形象是玩家在整个游戏中的关注点,但目前国内市场还存在大量千篇一律和乏味的角色造型,对于MOBA游戏原画设计的理论和设计方法还比较匮乏,急需视觉相关的审美理论来指导原画设计思维。从这一角度,通过阅读相关审美理论,选择视知觉理论来探索MOBA游戏原画的审美呈现。视知觉理
多主元高熵合金由叶筠蔚等学者在2004年提出,并迅速成为研究热点。不同于传统金属学理论,高熵合金一般具备5~13种主要元素,每种主元所占原子比在5%~35%之间。根据不同的实际工业用途可以设计不同成分高熵合金以满足生产需求,使其展示出优异的机械性能、耐蚀性、热稳定性和抗辐射性等。为了改善高熵合金强塑性匹配及铸造性能等问题,卢一平等学者在2014年提出共晶高熵合金的设计理念。共晶高熵合金相比于普通高
为了保障复杂机械设备的安全可靠运行,近年来国内外学者开发了多种基于传统机器学习与深度学习算法的设备故障智能诊断模型。在实际工程应用中,在设备不同工作状况下采集的监测数据往往服从不同的分布,使得在原工况(源域)下训练的智能诊断模型难以适用于新的工况(目标域)。此外,给采集到的监测数据添加标签依赖于专家在专业领域的知识与经验,费时费力。因此,在机械设备改变工况后(目标域),标签数据的获取十分困难,无法
仓储调度问题是智能仓储研究的重要课题方向之一。一个好的调度方案能有效地提升仓储效率和高效地处理订单需求,对于物流企业服务质量和经济效益的提高都有很大的帮助。然而,这一研究路线中的研究模型或者方法中没有同时考虑不确定效果和并行动作,而且存在人工干预和可解释性差等局限性。另一方面,尽管概率并行规划可以同时对不确定性效果和并行动作进行建模,但是现有的概率并行规划求解器无法有效地解决大规模问题。因此,本文
近红外长余辉发光材料是一种能够吸收高能紫外线或者可见光等的能量并在激励停止后能够继续发出近红外光一段时间的特殊材料,它在高分辨率生物成像、近红外照明、光学防伪、高灵敏度生物传感、高转换效率太阳能电池和潜在的军事活动等领域提出了一些富有想象力的应用。然而对近红外长余辉材料的探索过程仍处于初步阶段。虽然近些年来,对近红外长余辉材料的研究和机理的探索取得了一定的成果,但是目前来说主要还是选择高成本的镓酸
学位
制鞋业是国民经济的一个重要的产业,其中鞋底点胶是制鞋业中一个重要的工序,随着人工智能技术的发展,鞋底点胶领域通过引入人工智能的技术,能够智能指导点胶机的六轴机械手自动点胶,但是传统的算法在识别鞋底边缘轮廓存在识别的结果不清晰,无法构成有效的点胶路径点做规划,且无法在规定的时间内完成点胶路径的规划,严重影响了鞋底点胶生产的效率与准确性。针对现有的点胶加工方法中算法实现复杂、路径规划效率低与规划不合理
仿人机器人的驱动器是仿人机器人系统的核心之一,驱动器性能与特性对于仿人机器人来说至关重要,它决定了机器人的运动性能和控制难易程度。本文所设计的仿人机器人驱动器采用的是准力矩电机,亦叫本体驱动器(Proprioceptive Actuator),它由大扭矩力矩电机串联低减速比减速箱(10:1以内)组成。相比于传统的高减速比或基于串联弹性机构(SEA)驱动器,它能通过电流环做精准的力控,同时还具备高频