【摘 要】
:
目的:基因表达谱芯片技术的产生,为复杂疾病致病机理的研究提供了全局化的新视角,而计算机数据挖掘技术能够从这些大量的基因表达谱芯片数据中挖掘有用的信息和总结生命的规
论文部分内容阅读
目的:基因表达谱芯片技术的产生,为复杂疾病致病机理的研究提供了全局化的新视角,而计算机数据挖掘技术能够从这些大量的基因表达谱芯片数据中挖掘有用的信息和总结生命的规律,从而也就开创了数据挖掘技术中的特征选择方法在分子生物学领域的新应用.然而传统的特征选择方法(主要指缠绕法和镶嵌法)致力于通过改善搜索算法和分类学习算法获得较优的特征子集,很少从特征自身的特点出发去进行相应的改善.该课题中,我们将重点从特征自身的特点,包括特征的局部性、稳定性、有效性、分类学的冗余性和生物学的相关性,以及特征的可解释性这几个方面进行改善,从而运用这些特征获得好的分类效能和明确的生物学意义.方法:局部性、稳定性和有效性的特征子集选择过程是在"局部特征选择与特征融合技术"方法模块中实现的,特征的分类效能评价在双重整合评价器和其它四种分类器中实现,分类学冗余而生物学相关的特征运用"分类学冗余而生物学相关特征的再寻找方法"实现,特征的可解释性通过将特征映射到基因功能分类体系Gene Ontology中实现.整个课题思路即在样本扰动技术的支持下,选用特征选择的镶嵌法,以决策树作为分类器产生一系列候选的局部(目标类样本区别于非目标类样本)特征子集,继而在分类效能的指导下挑选出具有两类鉴别力的有效的候选局部特征子集.通过特征融合技术,我们找出不依赖于训练样本结构分布的稳定的不同层次的核心基因簇集和非随机个体特征集,而特征的分类学效能采用双重整合评价器和其它四种分类器进行评价.进一步采用"分类学冗余而生物学相关特征的再寻找"方法,将找出的非随机稳定出现的特征删除以后再重复以上方法进行非随机个体特征的再挑选,回找到的尽可能多的基因并入非随机个体特征集中,最终的非随机个体特征集中的基因为特征基因.我们将这些特征基因映射到Gene Ontology中挖掘特征的生物学意义.整个特征选择的过程以分类器的分类效能为辅,特征子集的挑选为主,将分类效能作为一种筛选和评价尺度贯穿于特征选择的全过程.结论:从特征自身特点出发的特征选择方法可获得好的分类效能和生物学解释.
其他文献
丝状真菌中的里氏木霉和草酸青霉,由于能够分泌大量木质纤维素降解酶,在工业生产纤维素酶或半纤维素酶领域得到了广泛的应用。外界环境信号,如碳氮营养的可利用性或离子浓度等,对
孤啡肽(Nociceptin,NC)是1995年发现的阿片受体样受体(Opioid receptorlike1 receptor,ORL1)的内源性配基,孤啡肽同经典内源性阿片肽在结构上有很高的同源性,但不结合于经典
目前六氟化硫气体具有优良的性能已在电力系统中得到普遍认可与应用,六氟化硫气体的运行状态、气体性能、密度、微水含量等性能指标严重影响着设备、电网的安全运行,因此对电气设备进行在线监测、状态检修已是当下流行的技术趋势,电气设备中的六氟化硫气体的在线监测与状态检测则显得越来越重要,而传统的监测技术受制于各种因素影响,往往结果不尽如人意。本文基于加热气体循环法及气缸活塞气体循环法的新原理,研究开发了一套六
减毒沙门氏菌VNP20009能够特异性地靶向到肿瘤组织中并在肿瘤组织的乏氧区大量繁殖,并表现出良好的抗肿瘤疗效,是细菌介导的肿瘤治疗的典型代表,目前被广泛地用作抗肿瘤载体。在
钙调磷酸酶(Calcineurin,CN)是目前已知的唯一一种活性受细胞内第二信使Ca/CaM调节的蛋白磷酸酶,广泛分布于哺乳动物的各种组织器官,尤以脑中含量最高.CN不仅参与多种生理功
随着我国电网“西电东送、南北互供、全国联网”战略的逐步实施,特高压直流输电以其经济、灵活、快速可控等优点在远距离大容量输电及大型电网互联中发挥着越来越重要的作用。同时国内外出现了大量通过特高压直流输电来连接两个地区电网的输电工程,但是受端交流系统采用分层接入的直流输电工程在国内外还不多见。本文依托的上海庙-山东特高压直流输电工程采用分层接入方式与受端交流系统相连,本文基于电磁暂态仿真软件PSCAD
本论文设计、分析并试制了WSZ80A高效率抽油烟机用无刷直流电动机。首先,对WSZ8OA无刷直流电动机进行了整体设计。绕组采用节距为1的分数槽集中绕组,此种绕组各个线圈端部没有重叠,不必设相间绝缘,并且缩短了端部长度,使得电动机绕组的电阻减小,铜损随之降低,有利于提高电动机的效率。定子冲片采用拼块式冲片,特点是将每个定子齿单独作为一块定子冲片,然后再拼合成整个电枢。对于本机来说,电枢材料节约了40
目前,风电在全世界范围内获得大力开发与应用。在其快速发展的同时,其消纳情况并不尽如人意,存在大量的弃风现象。造成该情况的主要原因为风电发展规划侧重于集中规划,而缺乏具体的风电送出和风电消纳方案,且电网建设与风电发展不能同步。应当在电网规划建设过程中计及风电场的影响。另一方面,风电并网时,考虑风电场出力受自然因素影响具有不确定性,实际工程中可以预测却难以控制,加之电力企业的市场化改革,电网将面临更多
在电力电子技术领域中,交流调压技术作为一个非常重要的部分,已经越来越受到了人们的广泛关注。近些年,交流调压器通常是采用模拟控制,但是随着高性能可编程逻辑器件(FPGA)在
该文研究了乳酸菌降解亚硝酸盐的机理,在此基础上选育出降解亚硝酸盐能力较强的乳酸菌菌株,并对其影响因素进行了研究.1.乳酸菌降解亚硝酸盐的机理为:乳酸菌对亚硝酸盐的降解