乳腺癌发生的特征基因筛选及模式识别

来源 :生物化学与生物物理进展 | 被引量 : 0次 | 上传用户:zuiainivip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文选取癌症基因组图谱数据库的乳腺癌样本作为数据集,在全基因组的水平上研究乳腺癌病人从正常到发病Ⅰ期基因表达的变化,寻找与乳腺癌发病密切相关的特征基因,建立乳腺癌发生的模式识别分类方法,为乳腺癌预防及早期诊断提供理论支持.研究中,综合利用相关性、t检验、置信区间等统计学方法,建立乳腺癌发生特征基因筛选方法,获得与乳腺癌发生具有显著性差异的特征基因336个.通过机器学习方法建模,得到的分类准确率能达到98%以上,与之前乳腺癌相关的研究相比,准确率更高.同时采用KEGG(kyoto encyclopedia of genes and genomes)通路分析得到与基因显著相关(P<0.05)的通路有8个,GO(gene ontology)基因功能富集分析显示与基因显著相关(P<0.05)的功能有18个.最后对映射在8个通路中的一部分基因进行简要功能分析,说明了其在调控水平上的密切关系,表明识别的特征基因在乳腺癌的发生过程中有重要的作用,这对了解乳腺癌发病机理以及乳腺癌的早期诊断非常重要. In this study, breast cancer samples of cancer genome database were selected as data sets to study the changes of gene expression in stage Ⅰ of breast cancer patients from normal to disease-oriented at the genome-wide level to find out the characteristic genes closely related to the pathogenesis of breast cancer and to establish breast cancer occurrence , Provide theoretical support for the prevention and early diagnosis of breast cancer.In the study, the comprehensive screening of characteristic genes of breast cancer by statistical methods such as correlation, t-test, confidence interval and so on, The number of significant differences in the characteristics of the genes 336. By machine learning method modeling, the classification accuracy can be achieved more than 98%, compared with the previous breast cancer-related studies, the accuracy rate higher.Meanwhile, KEGG (kyoto encyclopedia of genes There were 8 pathways that were significantly correlated with genes (P <0.05), and gene enrichment analysis of GO (gene ontology) showed 18 genes that were significantly associated with genes (P <0.05). Finally, A brief functional analysis of a portion of the genes in the eight pathways revealed their close relationship in regulation and control, indicating that the identity of the recognition Because of the important role of breast cancer in the process, which is very important for understanding the pathogenesis of breast cancer and the early diagnosis of breast cancer.
其他文献
随着科技进步和社会生产力的极大提高,人类创造了前所未有的物质财富,加速推进了文明发展的进程.然而与此同时,由于现行的体制、制度、技术和资金等方面的原因,生态环境系统
GH4199合金是一种高强度、可焊接抗氧化的镍基变形高温合金,主要用于飞机发动机相关部件,相当于原苏联Эп199合金,国内首次研究.该文对GH4199合金进行了初步研究.着重从以下
由于人们在含稀土锰基钙钛矿结构氧化物如ReAeMnO(Re为三价稀土离子,Ae为二价碱土离子)中超大磁电阻的发现,使得该类材料成为材料科学和凝聚态物理的热点研究课题之一.该论文
嵌段共聚物的不同嵌段由于热力学不相容性,导致嵌段共聚物发生相分离,形成多种自组装结构。很多研究表明嵌段共聚物纳米粒子能形成多种新型的自组装结构。这些自组装体在载体、催化、药物递送等领域都具有潜在的应用价值。目前,众多研究主要集中在加入的均聚物和纳米粒子的直径D与嵌段共聚物本体重复周期L0的匹配程度两个方面,然而不同种类的表面活性剂对嵌段共聚物纳米粒子的自组装结构的影响却很少有报道。因此,本文主要涉
我国水资源匮乏,淮河、海河等北方河流极度缺水,流域闸坝众多。基流匮乏、重污染是我国北方河流的典型特征。基流匮乏重污染河流治理被公认为世界性难题,还缺乏成功经验与实践案例。淮河二级支流-贾鲁河是流经郑州的典型基流匮乏型重污染城市河流。在“十一五”及“十二五”国家重大水专项支持下,通过再生水大尺度生态补给,贾鲁河水质有了根本性改善。然而,由于城市尾水来源复杂以及当前工艺局限,再生水中仍含有种类繁多的微
作者探讨了基于知识工程设计的基本过程、特点和关键技术,将知识工程与三维造型系统相结合,通过三维设计系统和设计知识之间的迭代实现产品功能信息在设计各阶段、各部分之间
该文采用室内培养和生物盆栽试验从三个方面研究了不同外源有机酸处理对土壤中重金属铅、镉的影响:(1)重金属形态转化和各形态随时间的动态变化;(2)重金属生物有效性和和植物
强化絮凝处理城市污水已成为近年国内外研究与应用热点问题之一.该文在系统地论述强化絮凝及其生物组合工艺技术发展与应用现状的基础上,针对中国现阶段城市污水处理面临的投
采用热不对称交错聚合酶链式反应(Tail-PCR)克隆云南磷矿来源昆明假单胞菌(Pseudomonas kunmingensis)HL22-2的海藻糖合酶(TreS)基因HL22-2TreS,将该基因与表达载体pETM3C连
随着半导体行业的飞速发展,宽带隙半导体材料(如SiC等)因其优异的性能在功率器件领域受到越来越广泛的关注。但是SiC大功率器件的应用给封装带来了很多挑战,比如封装器件需要在高