基于随机森林和解卷积优化算法的宫颈癌代谢组学生物标志物筛选及相关网络研究

来源 :哈尔滨医科大学 | 被引量 : 0次 | 上传用户:jxgalcj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究目的:内源小分子代谢物浓度水平的变化为恶性肿瘤诊断和化疗敏感标志物的研究提供了丰富的信息。从生物学上看,首先是DNA(基因组)被转录为mRNA(转录组),然后由核糖体对mRNA进行翻译产生蛋白质(蛋白质组),最后蛋白质被催化成各类代谢产物(代谢组)。通过代谢组数据,可以研究机体在外界刺激或基因改变的影响下随时间变化的代谢模式特征,辨识和解析被研究对象的生理和病理状态。然而,目前能够解析的物质仅占所有代谢产物的5~10%,更具挑战性的工作,是进一步确认所有代谢物的功能,需要研究与肿瘤相关的各种物质的代谢关系网络。为此本研究给出一种基于随机森林和网络解卷积优化算法的网络构建方法,该方法利用回归树和随机森林(RF)回归方法内嵌的变量排序机制以及解卷积构建任意两变量的关联矩阵,通过将其分解为具有直接关联和各种长度间接关联的矩阵之和,从而识别出网络中的直接相关性,移除由于级联效应而产生的间接相关性边,构建网络揭示变量之间隐含的信息。  研究内容:根据随机森林、网络解卷积的原理和特点,提出基于随机森林回归的构建网络方法基础上联合网络解卷积算法(RF-ND)进行优化,并确定基于随机森林回归以及联合网络解卷积算法的适用条件;通过设定网络变量间具有线性及非线性关系以及网络结构的复杂程度,探索基于RF回归以及联合ND的RF-ND算法构建网络的有效性;建立宫颈癌早期诊断及化疗敏感性的血浆代谢物的相关网络,并对其进行生物学解释,确定宫颈癌早期诊断及化疗敏感性的血浆生物标志物和相关代谢通路。  研究结果:本研究提出了一种基于随机森林、网络解卷积优化(RF-DN)算法,该方法不仅能够保证基于随机森林的原理构建出较为理想的网络,而且在网络结构复杂的情况下,通过网络解卷积优化算法移除网络中间接效应边,提高构建网络的准确性。  模拟实验表明RF对于预先设定的具有线性相关网络关系的识别能力明显优于贝叶斯方法,其中发现且随着样本含量的增加基于随机森林构建的网络准确性不断提高,但传统经典的贝叶斯方法效果基本保持不变。基于随机森林回归构建的网络针对变量之间存在非线性相关关系时识别效果明显优于贝叶斯方法。此外模拟试验结果表明当网络中变量少且结构相对简单的情况下,使用网络解卷积优化算法后的随机森林网络构建方法与单纯基于随机森林算法效果近似;但当网络结构中具有较多变量且数据结构复杂时,经过网络解卷积优化后能够明显提升网络构建效果。  宫颈癌早期诊断血浆代谢组学研究结果表明宫颈癌与卵巢癌、正常对照之间存在代谢模式差异,经单变量和PLS-DA分析筛选后确定了正负离子模式下共计382个差异变量,经过进一步的数据库查找和二级物质鉴定,确定了其中35种差异代谢物。本研究利用已经确定的35种差异代谢物为基础,利用本文提出网络构建方法建立了代谢网络,并通过数据库信息和文献报道确定了网络的合理性。本研究推测出的宫颈癌代谢相关网络,其中部分关系已经确定证明了该方法的有效性,其余未知的代谢通路和功能需通过生物学实验进一步验证。  宫颈癌化疗敏感性血浆代谢组学研究结果表明敏感患者、中度敏感患者与轻度敏感患者之间具有明显的代谢模式差异,经单变量和PLS-DA分析筛选后确定了正模式下10个差异代谢物。基于本文提出的方法构建的代谢网络经文献报道验证具有合理性,为宫颈癌化疗敏感性机制研究及个体化治疗提供了参考依据。  研究结论:通过模拟实验和实例说明基于随机森林回归联合解卷积优化算法能够保证较好的网络重建效果。基于血浆代谢组学能够准确地区分宫颈癌与卵巢癌/正常对照,宫颈癌患者的血浆中代谢物相关网络提示其代谢通路变化,其发病可能与脂类代谢、色氨酸代谢、氨基酸代谢等密切相关。另外,基于血浆代谢组学能够区分宫颈癌化疗敏感与非敏感患者,其血浆代谢物的变化提示宫颈癌化疗敏感性与氨基酸代谢、脂类代谢及二肽代谢等紧密相关,为物质鉴定与个体化治疗提供了线索及依据。
其他文献
随着核科学技术的发展,人们发现质子和重离子的深度剂量分布非常适合于治疗肿瘤,重离子束成为21世纪放疗领域中最为先进和有效的方法。重离子束治疗肿瘤技术和装备的研究已引起
该研究选择了具有低浓度混苯暴露的特大型石化企业Y公司,并以无混苯暴露的特大型化纤企业H公司为对照,通过现场环境监测和生物学检测、女工生育机能的流行病学调查、尿液人绒
肺癌是当今全世界发病率和死亡率增长最快,对人类健康和生命威胁最大的恶性肿瘤。在欧美发达国家不论男女均已占常见肿瘤的首位,在我国沿海城市肺癌在男性中已占首位,在女性中居
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
小葵子小葵子属菊科,一年生草本植物。原产热带东非,是埃塞俄比亚的一种主要油料植物。据云南省植物研究所,德宏州农科所调查研究、分析鉴定结果,证明小葵子具有生长期短、
该研究试图通过对中国部分地区35-64岁人群血液叶酸、同型半胱氨酸基础水平的调查,了解不同地区、季节、性别及年龄中青年人群血液叶酸、同型半胱氨酸水平的分布特征,同时对研
近年来,不少地方从世界银行等国际金融组织引进贷款,用于发展工农业生产和基础设施建没。对促进和推动经济发展起了积极作用。但是由于个别单位和部门对正确利用世行贷款的
龋病是在以细菌为主的多种因素影响下,牙体硬组织发生慢性进行性破坏的一种疾病。牙菌斑生物膜中致龋菌代谢产酸,导致局部硬组织脱矿是龋病发生的最直接原因。现代龋病学理论认
碳酸氢铵化肥的合理施用已有许多研究报道,深施可以减少肥分损失,增加施肥效果,提高肥料利用率。然而,对于窄行密播的小麦、谷子等作物追肥,难以实行深施,若将全部肥料在播
在电力系统中,故障录波器不可缺少的测量元件是互感器。互感器在不同的测量范围内其误差不同,直接影响着故障录波器的采集精度。为提高测量精度,消除不同测量范围内的误差影响,文