泛癌公共驱动通路识别模型和算法研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:makeitreal
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高通量测序技术的飞速发展,从癌症分子水平上了解致癌的发病机理已成为现实。研究发现导致癌症发生的失调信号通路或调控通路通常由多个驱动基因共同作用,即通路中任何一个驱动基因发生突变均会导致通路失调,从而引发癌症。在通路水平上研究突变,对于获得异质性模式和理解癌症形成更具有生物学意义,驱动通路识别问题应运而生,识别不同癌症之间的公共驱动通路是其中一个重要的子问题,本文对该问题进行研究,主要工作如下:对泛癌公共驱动通路识别模型进行研究,张等人2017年提出的ComMDP方法通过计算各癌症的绝对权重累加值来构造模型,以期找到累加值最大的通路。然而不同癌症样本数一般差异较大,计算各癌症的绝对权重累加值,可能会导致小样本癌症数据作用受到忽略,从而影响求解效果,遗漏某些驱动通路。针对该问题,本文提出基于相对权重累加值的求解思路,并利用方差或调和均值以最小化各相对权重离散度,由此构造泛癌公共驱动通路识别模型MDP1(Multi-cancer driver pathway 1)和MDP2(Multi-cancer driver pathway2)。针对识别模型MDP1和MDP2的NP难特性,提出两种基于智能优化算法的求解方法。通过引入一种短染色体编码和基于贪婪策略的重组算子,提出求解识别模型的单亲遗传算法PGA-MDP1和PGA-MDP2。通过引入二进制粒子编码方式、粒子速度表示和粒子运算操作,提出求解识别模型的粒子群优化算法PSO-MDP1和PSO-MDP2。利用模拟数据和真实的生物数据,对识别方法ComMDP、PGA-MDP1、PGA-MDP2、PSO-MDP1和PSO-MDP2进行性能比较,以分析本文提出的识别模型和算法对问题求解的有效性。首先利用模拟数据对识别方法ComMDP、PGA-MDP1和PGA-MDP2进行对比分析,结果显示基于模型MDP2的识别方法能够获得较基于MDP1模型方法和ComMDP方法更高的识别准确度。其次,利用模拟数据对算法PGA-MDP2和PSO-MDP2的准确度和运行时间进行对比分析,结果表明基于同一种模型和不同智能优化算法的识别方法,它们的识别准确度基本一致,主要差异体现在执行效率上,PGA-MDP2和PSO-MDP2方法的扩展性均较好,在求解大规模问题时仍具有较好的性能,且PGA-MDP2的执行效率比PSO-MDP2高。最后,利用真实的生物数据对ComMDP、PGA-MDP1、PGA-MDP2、PSO-MDP1和PSO-MDP2的识别性能进行对比分析。与ComMDP方法相比,本文提出的识别方法确实能够识别出被ComMDP方法遗漏且具有生物学意义的驱动通路。综上所述,本文对泛癌公共驱动通路识别问题进行研究,提出两种有效的识别模型和算法。实验结果表明,基于提出的模型和算法,确实能够识别出被ComMDP方法遗漏的一些具有生物学意义的驱动通路,它们可能成为识别癌症通路的有用补充工具。
其他文献
河南省大学生“华光”体育活动篮球联赛是由河南省教育厅主办,河南省学生体育总会篮球协会协办的河南省高校大学生篮球赛事。其承办单位主要由各高校之间竞选产生,主要考查各
近十年来,2μm光纤激光器因其在医疗、材料加工、激光通信和大气监测等领域所具有的独特优势而成为了科学研究的热点。多波长运行态和锁模运行态是2μm光纤激光器中应用广泛
俄罗斯境内国际过境运输的发展是“一带一路”倡议中俄中合作的领域之一。西伯利亚大铁路在国际过境的发展中起着主要作用,这是连接亚太地区和欧盟国家的铁路“桥梁”。西伯
氧化锌纳米线材料因其直接带隙和大的比表面积等特点,具有独特的光学性质和电学性质。近年来,氧化锌纳米线在众多领域中的应用被广泛研究,包括光电探测、气体传感、生物传感
随着人工智能的发展,各行各业都产生了各种各样的数据。这些数据呈现出海量、多元化、高维等特点。然而,在这些大数据中,很大一部分属性的作用是微乎其微的,它们增大了计算机
活塞是船用柴油机的“心脏”,它决定了柴油机的动力性、可靠性及经济性等,是柴油机最关键的部件之一。活塞通过高速往复运动传递柴油机的原动力,其加工精度的不达标通常会引起销孔开裂、侧部磨损以及外圆损伤等破坏性失效,影响柴油机的使用寿命。铸铁活塞是一种常用的船用柴油机活塞,由于其结构复杂、壁厚较薄且径向刚性较差等特点,而在生产过程中容易发生加工变形,难以保证加工质量。因此,研究船用柴油机铸铁活塞的加工工艺
写作在英语四项基本技能中处于很重要的地位,但又使许多外语学习者心生怯意。几十年来,许多研究者和教育者聚焦如何提升语言学习者的写作准确性。一些研究者(Ferris,2004;Fer
随着工业时代的逐步推进,机械设备的结构、系统、控制等之间的联系日趋紧密和复杂,无论是哪一部分发生了失效或出现了故障,都会牵一发而动全身,轻则机械设备性能无法实现预期功能、控制系统发生失效,重则产生灾难性的后果。机械设备故障的产生,除了会造成巨大的经济和财产损失外,严重的还会造成重大的人员伤亡、环境污染和恶劣的社会影响。因此,对机械设备的故障特征的研究,则是保证生产生活顺利进行的重要课题。故障诊断问
邰爽秋是我国近现代教育史上著名的教育家,民生本位教育思想的创始人和民生本位教育实验的践行者。邰爽秋因其卓越的理论贡献和躬身力行的实验创新精神,与陶行知、梁漱溟、晏
不平衡数据是指数据集中属于某一类别的样本量远超过其它类别的样本量,即所属不同类别的样本量间存在较大差异。研究人员常把在数量上处于劣势的样本称作正类样本,而把数量较