论文部分内容阅读
微小核糖核酸(microRNA)是生物体内一种调节性的小分子物质,能够特异性靶向某些基因起到转录后抑制基因表达的作用。然而,不同的微小核糖核酸究竟靶向哪些基因的研究还在持续,相关的预测研究及网络预测工具纷繁复杂,从实际应用角度上,如何合理选择预测工具挖掘出适合有效的信息是必须解决的问题。基于这一问题,拟设计一个检索系统,从资源的有效性与结果挖掘两方面考虑,以期收录更多的稳定可信的预测工具,并综合挖掘预测与验证信息,检索到全面并且直观的网络资源微小核糖核酸靶基因预测综合结果。研究重点是提取miRBase序列数据库网站中涉及的常用8个靶基因预测库和1个验证库的关键信息,定义数据统一格式,使用数据标准化方法计算出可信度衡量的基础分值,最终设计并实现一个可持续更新,灵活参数控制,拥有可视化网络图展示核心结果以及综合分值评估预测可信度的人类微小核糖核酸(microRNA)靶基因检索系统。最终设计并实现的检索系统主要由原始数据库、检索数据库生成程序和主检索程序构成。原始数据库直接收录多个预测库及验证库的关键数据,满足后续更新及灵活添加子库的拓展需求。检索数据库生成程序重点进行评估分值(adjustscore)计算,五个步骤标准化数据并自动化生成新的检索数据库。主检索程序拥有五个脚本,分别实现准备、数据提取、数据统计、数据结果生成、网络图展示的实际操作。检索时提供微小核糖核酸列表以及参数设置文件(config.txt),双击一般检索或者加权检索即可一次性检索出待选微小核糖核酸在多个网络预测库和验证库中的靶向基因综合总表信息、靶基因数量统计情况和阈值筛选结果表以及规模预控的可视结果网络图。系统的功能测试参数设定分严格与默认两种,数据库的选择分混合组、有值组、无值组,结合数量从1个、3个到全部的多维度测试检索功能。另外,运用了miR-17/92靶基因实例的预测,结合相关文献中实验验证的微小核糖核酸-17/92簇(miR-17/92)的靶向基因,通过和网络上同类整合数据库miRWalk2.0以及ComiR的比较,证明了本系统在实现便捷检索,灵活参数,可视化设定的同时也收录了不弱于其他整合预测库的可信信息。