初探应用关联规则筛选与癌症有关联性的SNP

被引量 : 0次 | 上传用户:walkeronmoon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景在单核苷酸多态性(SNP)与癌症患病之间的关联性的研究中,如何筛选出真正与癌症呈关联性的SNP已成为当前研究的热点。相关的研究和论著非常多,然而由于所应用的筛选方法不同,导致其结果并不一致。数据挖掘方法中的关联规则可从海量数据中筛选出事务之间潜在的关联,因此本研究考虑利用关联规则对与癌症呈关联性的SNP数据进行筛选。研究目的本研究的目的是,应用关联规则筛选与癌症呈关联性的SNP,力求控制筛选假阳性率和降低假阴性率;并在此基础上,探索筛选与癌症呈关联性的SNP-SNP交互作用项的方法。研究方法本研究采用随机模拟的方式评价关联规则在筛选与癌症呈关联性SNP的适用性。研究的技术路线为:1)以病例对照研究为背景,构建以癌症患病为因变量,SNP及SNP-SNP交互作用项为自变量的Logistic随机模拟模型;并生成随机模拟数据。2)对随机模拟样本进行等样本量的Bootstrap重抽样,并对Bootstrap子样本进行关联规则分析,结合Logistic逐步回归,来筛选与癌症呈关联性的SNP;3)对随机模拟样本进行关联规则分析,并对规则后件拆项,结合最优得分Logistic回归,探索筛选与癌症呈关联性的SNP-SNP交互作用;4)分析一例真实的SNP与癌症患病的实例数据,以验证本研究所提出方法的有效性。研究结果应用关联规则结合Logistic逐步回归来筛选与癌症呈关联性的SNP时,一方面可以大大降低筛选的假阴性率,即明显提高筛选的真阳性率;另一方面,其筛选的假阳性率估计的95%CI下限接近0.1。应用关联规则结合最优得分Logistic回归来筛选与癌症呈关联性的SNP-SNP交互作用时,得分最优的模型有38.2%的可能性包含原模型中的交互作用项。结论用关联规则的支持度和置信度和四格表χ2检验的P值对生成的关联规则进行初筛,联合Bootstrap再抽样和Logistic逐步回归,能够筛选出与癌症呈关联性的SNP,较之传统的Logistic逐步回归和Bonferroni校正法,其能在控制筛选的假阳性率基础上,显著降低筛选的假阴性率。用关联规则的支持度和置信度和四格表χ2检验的P值对生成的关联规则进行初筛,对后件拆项,结合最优得分Logistic回归,提出了一个筛选与癌症呈关联性的SNP-SNP交互作用项的分析策略,为进一步深入研究作了有益的探索。
其他文献
党的十八大报告要求"积极开展基层民主协商"。基层协商民主有利于改变社会大众被动式政治参与,减少各利益群体因不同诉求而产生的偏见;基层协商民主有利于化解社会矛盾,在理
《伤寒论》中关于喘的条文20余条,通过研读分析对喘证的辨治规律颇有所得。虽然均有呼吸急促之喘证,但不同的发展阶段表现的伴随症状不同,其治疗亦有不同,本人认为喘证也遵循
人口老龄化是21世纪一大全球性的社会问题,而我国的人口老龄化在经济转型、城市化进程这一特殊背景中尤显复杂性,面临形势极为严峻。智化养老作为现代科技与养老服务有机结合
<正>辛亥革命一声枪响,满清王朝划上了休止符,清廷以《大清刑律》为代表的法制改革昙花一现,中国法制近代化事业却没有停步。民国时期,在一次联合国代表大会上,骄狂的日本代
意识形态工作具有根本性、战略性、全局性意义,事关党的前途命运,事关国家长治久安,事关民族凝聚力和向心力。近年来,学界围绕互联网时代条件下社会主义意识形态建设面临的机
提出模拟土工格栅的薄膜单元和模拟结构层间作用的界面单元,利用基于线弹性断裂力学的有限元方法,对土工格栅防止沥青路面开裂的桥联效应进行研究;分析了这种桥联效应对半刚性基
新闻传媒在改变人们的思想观念方面,特别是塑造人们的精神世界所发挥的作用越来越大。当然随着社会经济的发展,其面临的问题也越来越多。正基于此,本文主要对新时期新闻媒体
浅述蒙医五疗法内蒙古中蒙医医院(010020)张红霞,那日格乐蒙医五疗法是蒙医学的重要组成部分,也是蒙医学的特色所在。它是灸疗、穿刺、放血疗法以及浴疗、拔罐穿刺、色布斯拉呼疗法等诸
韩愈和柳宗元虽然被并称“韩柳”,文学史上对二人评价实际上却存在着很大的差异,乃至形成“韩、柳优劣”的公案。本文指出,韩、柳优劣的问题在极大的程度上是二人之于佛氏的关系
"体育报道"已成为全球资本流向的重要领域,其具有强大的公众吸引力,是跨越国界的资源整合力、对经济的拉动力在国民经济中起到重要作用。故加快我国体育报道发展,成为我国新