基于生物分子网络的致病基因识别方法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:candle819
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
重大疾病的致病机理非常复杂。从遗传角度来看,复杂疾病是由基因-基因、基因-环境交互作用导致的结果,因此寻找致病基因是复杂疾病研究中的核心问题。基于高通量技术获得的多组学数据,能从不同层面反映复杂疾病分子变化图谱,有助于揭示复杂疾病致病机理。因此,开发高效的生物信息学方法,从多组学数据中识别出复杂疾病的致病基因成为非常关键的科学问题。现有研究方法大多基于连锁分析和全基因组关联分析,不能有效确定致病基因,同时存在成本高和假阳性多的问题。
  在细胞中,分子之间通常以相互作用网络的形式发挥具体的生物学功能,因此需从分子网络角度来识别致病基因。在分子网络中识别致病基因应用最广泛的是随机游走算法,尤其是PageRank算法。该算法虽在识别致病基因方面取得一定的研究进展,但在整合多组学数据、对应多层分子网络数据和遗传信息先验知识方面仍有较大的提升空间。本论文基于随机游走算法,同时整合多组学数据、对应多层分子网络和遗传信息先验知识,在不同应用背景下结合生物分子网络对致病基因、致病模块的识别方法进行了系统研究,分别提出了双层异质分子网络的双层排序算法、多层生物分子网络的整合排序算法、高维分子网络的张量排序算法和基于表型驱动的模块检测及排序算法,为整合不同组学数据和网络数据识别病致病基因、致病模块提供了可行的研究思路。本论文研究内容概述如下:
  (1)目前,基于PageRank算法识别致病基因在单层生物分子网络中的研究较多,而在双层分子网络中的研究相对较少。本论文针对双层异质分子网络中的致病基因识别问题,提出了基于双层异质分子网络的随机游走算法——双层排序算法。该算法基于权重整合疾病两种组学数据和对应双层分子网络,并加入遗传信息来创建特异性双层异质分子网络;基于双层排序算法,获得节点双层排序特征值,进而衡量节点重要性,并将其用于Ⅱ型糖尿病致病基因的识别。结果表明,双层排序算法能有效识别致病基因,该算法为整合两种组学数据和对应双层分子网络识别致病基因提供了参考。
  (2)将多组学数据与对应多层生物分子网络结合用于识别致病基因已成为研究热点,现有方法大多基于整合多个网络结构或部分组学数据和网络,没有把对应的组学数据与网络进行有效整合。本论文针对多层生物分子网络中的致病基因识别问题,提出了基于整合的有约束随机游走算法——整合排序算法。该算法基于权重整合疾病多组学数据和对应多层分子网络,加入遗传信息来构建多层特异性分子网络,以约束的形式嵌入多层网络的信息流向;基于整合排序算法,获得节点整合排序特征值,进而衡量节点重要性,并将其用于肝癌和前列腺癌致病基因的识别。结果表明,整合排序算法能有效识别多层分子网络中的致病基因,与其他算法相比具有显著优势。该算法以约束的形式嵌入了遗传信息先验知识,为整合多组学与对应多层分子网络识别致病基因提供了借鉴。
  (3)在识别复杂疾病致病基因时,存在异源多组学数据,如何将这些数据和分子网络进行有效整合用于识别致病基因已成为研究关键。现有方法大多基于整合多个单层网络中心度结果,忽略了数据的整体性。本论文针对高维分子网络中的致病基因识别问题,提出了基于张量的随机游走算法——张量排序算法。该算法基于权重整合疾病异源多组学数据和多属性分子网络创建高维特异性分子网络,用张量表示;基于张量排序算法,获得节点张量排序特征值,进而衡量节点重要性,并将其用于识别Ⅱ型糖尿病和阿尔兹海默症的致病基因。结果表明,张量排序算法能有效识别高维分子网络中的致病基因,效果优于其他方法。该算法将运算从矩阵空间提升到张量空间,为从多维异质异源高通量组学数据中识别致病基因提供了一般性的方法框架。
  (4)在生物分子网络中,分子一般组成网络模块或通路来发挥其具体功能,因此致病模块的识别尤其重要。现有方法大多基于网络聚类或基因集分析,鲜有算法将二者结合。本论文针对生物分子网络中的致病模块识别问题,提出了基于表型驱动的模块检测和排序算法——模块排序算法。该算法基于权重整合疾病单组学数据和对应单层分子网络构建特异性分子网络,利用有指导的网络模块检测策略;以模块为节点,建立网络超图,基于超图的模块排序算法识别致病模块,将其用于肝癌致病模块的识别。结果表明,模块排序算法能有效识别致病模块,与其他算法相比具有优势。该算法结合了有指导的模块检测策略,实现了从识别网络中单节点模式特征到网络局部特征的拓展。
其他文献
浩如烟海的纸质文献是人类的宝贵财富,目前面临大规模的酸化老化现象,其中20世纪中后期的书籍文献等老化尤为严重,其用纸有相当一部分是酸性施胶的滑石粉加填纸。为了有针对性的保护这部分宝贵的文献资料,本文以滑石粉加填纸为研究对象,通过加速老化,在研究滑石粉老化后结晶程度、pH、电导率、粒径、白度、zeta电位等性能变化的基础上,研究了不同滑石粉加填量、酸性施胶条件下滑石粉的加填量等纸张加速老化后其pH、
该文首先阐述了水泥混凝土路面的结构特点、材料特点和破坏特点,然后根据混凝土的材料特点和物理、化学反应特点,分析了路面板初始损伤的形成机理和分布规律,并根据路面板在凝结过程中的受力情况,阐明板底初始裂缝的形成机理.在此基础上,根据水泥混凝土的损伤演变规律和路面板在荷载作用下的应力分布特点,分析了水泥混凝土路面板在荷载作用下的损伤特点,并根据断裂力学的原理,建立模型,进行具体数值的计算,分析板底裂缝的
飞翼布局无人机在气动效率和隐身性能上具有明显优势。随着无人机技术的进步,具备多任务能力的无人机逐渐成为研究热点。但是不同任务需求所规定的任务剖面不一,单一机型通常难以兼顾各飞行任务下的最优性能。无人机族策略为实现多任务能力提供了一种解决方案。本文研究对象是一种飞翼布局无人机族概念方案,包括打击和侦察任务的两个子机型,机身设计为通用平台,机翼设计为专用可替换模块。本文目的是为飞翼布局无人机族总体参数
学位
共轴高速直升机气动干扰研究是直升机空气动力学领域的一个热点研究课题。本文结合嵌套网格技术和虚拟桨叶模型,建立了基于CFD方法的共轴高速直升机双旋翼/机身/尾推干扰流场的数值模拟方法,应用该方法进行了悬停及前飞不同工况参数状态下共轴双旋翼、共轴双旋翼/机身以及共轴双旋翼/机身/尾推干扰流场的数值模拟研究。主要研究内容如下:  首先,第一章阐述了本文的研究背景及研究目的,分析了共轴高速直升机以及共轴双
学位
自Raisbeck1978年首先开展AMS10Be测量以来,经过近30年的发展,AMS10Be测量技术水平有了很大提高,测量本底不断降低,10Be计数率也不断提高。随着各种抑制10Be的同量异位素的方法的不断出现,使比较小型的AMS系统也能够用于10Be测量,但测量本底仍然较高。目前国际上基于大型加速器的AMS10Be测量容易达到较高测量灵敏度,小型化系统达到还有一定困难,中型系统经过仔细选择设计
学位
采用RFQ加速器中子源对于中子照相装置的小型化、可移动化具有非常重要的意义,从而对于中子照相应用的推广和新领域的开辟有重要作用。鉴于Be(d,n)反应在氘束能量小于3MeV时仍可获得较高的中子产额,北京大学正在发展基于RFQ加速器并采用Be(d,n)反应的小型中子照相装置。为了更好地设计和优化此装置,实现高质量的中子照相,我们在北京大学4.5 MV静电加速器上建立了中子照相实验平台,模拟基于厚铍靶
学位
为提高杉木加工利用附加值,将纳米高新科技与木材功能性改良相结合,采用溶胶凝胶法和微波辅助液相沉积法制备了杉木/TiO2复合材料,使半导体光催化材料TiO2以纳米薄膜的形式被负载于杉木表面,以期获得特殊的环保功能性。利用XPS、XRD、SEM-EDS、TEM、FTIR、JC2000A、TG-DSC、UV-VIS分析手段,对杉木/TiO2复合材料的形貌、表面结构与性能、TiO2在杉木/TiO2复合材料
学位
随着工农业生产的迅速发展,有机物种类的递增,水源的有机污染也在加剧.经常规处理后水厂出水已不能满足居民饮用水的要求.饮用水深度净化问题刻不容缓.UV-O联用技术作为一种新的水处理工艺,以其快速彻底的氧化特点,引起了人们的关注.该试验确定了紫外灯应用于水处理工艺的最佳参数,包括波长、光强、照射深度、水力要求等.该试验以自来水、苯胺、腐殖酸、硝基苯、对硝基苯酚、氯仿等为研究对象,考察了单独臭氧、单独紫
学位
胶质瘤是最常见的原发性脑肿瘤,有着高病发率、高死亡率的特点,严重危害着人类的生命健康。随着医学成像技术的发展,医学影像已成为辅助医生进行医学诊断和研究的重要手段,其中核磁共振成像(Magnetic resonance imaging,MRI)技术,由于其具有非入侵性、良好的空间分辨率和软组织分辨率等优点,被广泛应用于脑成像。脑肿瘤分割有助于医生对患者做出早期诊断、治疗规划和预后评估,但是手动分割费
蛋白质是生命活动的主要承担者,其序列决定生物的功能和性质,蛋白质功能预测能够揭示生命的本质现象和生理机能。因此,基于序列对蛋白质功能的探索不断推进。自人类进入后基因组时代,蛋白质序列的数量呈爆炸式增长,然而使用传统的实验方法实现蛋白质功能预测成本高昂、周期较长,且难以完成数量巨大的蛋白质功能测定。计算机技术的迅猛发展促进了数据挖掘和机器学习的研究进展,计算机建模方法为生物序列功能的研究提供了另一条