【摘 要】
:
近年来,长链非编码RNA(Long non-coding RNA,lncRNA)已被证明在各种生物过程中发挥着重要作用,与多种人类疾病有着密切联系,然而这些lncRNA在疾病中的作用机制尚不完全清楚。此外,当前已有的数据库缺乏对lncRNA功能的记录,而传统的生物实验和临床研究成本高昂。因此,推断lncRNA在疾病中的功能,探究其与疾病的潜在关联仍是当前生物信息学的一个重要挑战。针对上述背景,本文
论文部分内容阅读
近年来,长链非编码RNA(Long non-coding RNA,lncRNA)已被证明在各种生物过程中发挥着重要作用,与多种人类疾病有着密切联系,然而这些lncRNA在疾病中的作用机制尚不完全清楚。此外,当前已有的数据库缺乏对lncRNA功能的记录,而传统的生物实验和临床研究成本高昂。因此,推断lncRNA在疾病中的功能,探究其与疾病的潜在关联仍是当前生物信息学的一个重要挑战。针对上述背景,本文主要工作如下:(1)提出了功能相似性计算模型IDSSIM(LncRNA functional Similarity calculation model based on an Improved Disease Semantic similarity method),旨在利用已知的lncRNA功能和lncRNA的相似性来推测lncRNA未知的功能。该模型在疾病相似性计算部分进行改进,提出了信息内容语义贡献因子。语义贡献因子通过疾病在全部的有向无环图(Directed Acyclic Graphs,DAG)中的出现概率来量化不同疾病的信息价值,从而保留疾病的特异性,提高了疾病相似性计算的精确性。疾病相似性经过进一步处理,可以得到更为精确的lncRNA功能相似性。最后,为了验证模型的有效性,将模型放入lncRNA-疾病数据中,与其它三种现有模型进行比较实验,从AUC(Area Under the Curve)值和案例研究两方面进行评估。实验结果表明该模型取得了良好效果,对推断lncRNA的功能做出了一定贡献。(2)设计并实现了lncRNA功能相似性计算系统。在IDSSIM功能相似性计算模型的基础上,本文设计并实现了lncRNA功能相似性计算系统。系统在开发的过程中,采用了B/S(Browser/Server)架构,逻辑上应用MTV(Model-Template-View)模式,前端使用HTML、CSS、Java Script等技术组合,后端使用Django框架,数据库则用My SQL来实现存储。这些技术保障了系统可以兼容当前主流浏览器,且未来可以根据新需求进行拓展。系统实现了查询、计算、预测、数据分析等功能,为研究者提供了完整的计算流程,促进了lncRNA功能相似性的研究。
其他文献
汉语中存在大量特殊复杂的论元结构,包括“把”字句、“被”字句、存现句、主宾倒置句等。前人已从配价语法、生成语法、构式语法、类型学等视角对汉语中的论元结构进行分析与解释,但是目前关于汉语论元结构的研究层面较为单一,对系统性揭示汉语论元结构的生成机制能力有限,而在格模式下对论元结构的研究较少且存在一系列问题:1)多从狭义形态理论出发考察汉语的论元分布问题;2)研究中的术语混乱,汉语动词归类标准不统一;
英语冠词系统包括三类冠词,定冠词、不定冠词和零冠词。由于英语冠词系统的复杂性,一些研究者认为英语冠词是不可学或不可教的,但是冠词对于语言学习来说又是尤为重要的,特别是在学术写作中。前人主要从名词角度对冠词错误使用进行了研究,但有研究者指出冠词的使用并不只是由名词或名词短语决定。本文的主要目的是从词块使用角度,探究中国硕士研究生和博士研究生在学术写作中定冠词使用错误情况。借助词块探究定冠词使用错误是
本翻译实践报告是以韩国作家河成兰的韩国短篇小说集《邻家女人》一书为翻译文本。全书由十个短篇小说组成,第一篇小说《邻家女人》为本书的标题之作。小说集的主人公们大部分是游走在社会边缘的人群,例如家庭主妇、汽车销售员、商场监控员、日料店主厨等。本书作者河成兰,被誉为“超精细描写女王”,其作品不仅带有极为细腻的女性气质,同时奔放的想象力与清醒的现实感并存。1通过小说的细腻描写,我们不仅可以切身体会到社会边
随着癌症基因图谱(The Cancer Genome Atlas,TCGA)计划的实施和新一代测序技术的发展,产生了海量复杂的生物组学数据。这些组学数据中蕴含着丰富的有关生物功能与基因调控等的遗传密码。如何在海量组学数据中探索并提取关键数据以获得重要组学信息是当前的研究热点之一。传统的矩阵相关的数据处理方法在不同领域取得了一定的成效,但基于矩阵的数据表达方法存在一个明显不足,即矩阵模型不能充分探索
本文设计并实现了一个阿尔兹海默症(Alzheimer’s Disease,AD)辅助诊断系统。该系统使用前后端分离的架构,前端使用Vue,后端使用Django框架,实现了针对用户输入的功能性磁共振成像(functional magnetic resonance imaging,fMRI)数据矩阵,使用机器学习方法判别样本所有者是否处于AD状态或轻度认知障碍(MCI)状态或健康(HC)状态的功能。本
互联网+模式的飞速发展,为线上教育聚集更多优质资源提供了便利条件,使其摆脱了时间和空间的束缚。近年来,尤其是新冠疫情以来,相较于线下教育的举步维艰,线上教育备受人们青睐。然而,随着线上教育系统的广泛应用,其弊端也日益突显。中心化管理和单点存储模式使得用户信息易被篡改或丢失,用户和系统之间缺乏信任。因此,亟需构建一种信任方案保障线上教育系统的可信度。区块链具有不可篡改和易溯源等特性,符合线上教育系统
随着移动互联网和社交网络的迅速发展,社交媒体已经成为人们日常娱乐、交流分享、获取信息的重要平台,新浪微博作为国内受众最大的社交媒体,影响着人们生活的方方面面。与此同时,微博的巨大流量也催生了微博水军这一黑色产业,他们受利益驱动,散播垃圾信息或谣言,扰乱了网络传播秩序,引导社会舆论,给个人和集体带来了不利影响。如何有效地快速识别微博水军,对净化网络环境、维护网络秩序具有重要意义。传统的网络水军识别研
移动终端应用系统已经深入到人们的日常工作和生活中,其中界面设计与开发的工作量在整个移动应用开发中所占的比重较大。目前大部分的移动应用开发都是面向特定平台(如Android、i OS等)的,同一应用系统界面的开发要针对不同的平台开发不同的版本,这需要花费较大的代价。而且传统开发方法以手工编码为主,普遍存在开发效率低、难以维护等问题,还导致应用程序在扩展性和健壮性等方面不能满足系统开发需求。采用模型驱
近几年,北斗卫星导航系统不断发展,其定位精度也得到了极大提高,北斗高精度在各类软件中的应用越来越广泛,在应急救援、安全监管等方面都起到了极为重要的作用。并且北斗卫星导航系统也已成功进入到3GPP国家移动通讯组织,将北斗技术与各新兴技术相结合将会成为接下来几年的发展趋势。随着移动通信的不断发展,智能手机、平板等移动终端普及到千家万户,各式各样的应用软件也层出不穷,应用软件使移动终端的功能更加实用且丰
癫痫(Epilepsy)是大脑神经元异常放电引起的一种脑部疾病,同时也是最常见的神经系统疾病之一,其发作时一般表现为牙关紧咬,四肢抽搐,严重时会导致尿便失禁、意识丧失,甚至危及生命。脑电图(Electroencephalogram,EEG)是目前诊断癫痫的主要工具,其中包含了大量的生理和病理信息,脑电信号的分析为医生的诊断提供了指导。目前,癫痫的临床诊断多是依靠医生的自身知识储备和经验,通过肉眼观