CePa:一种识别显著基因集合的新方法及其在线数据分析平台的搭建

来源 :南京大学 | 被引量 : 0次 | 上传用户:cpu1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因芯片技术的出现使细胞生物学实验模式从传统的单个或少量基因研究跃变到全基因组的水平,是生物技术领域一次伟大的革新。为了找出隐藏在海量芯片数据中的客观规律,揭示生物体的奥秘,近年来人们尝试了多种数据分析方法来分析基因芯片数据,从传统的简单的排序到如今的人工智能。基因表达芯片数据分析作为基因芯片技术在实际应用中必不可少的步骤,是一个系统性的过程,其中每一步都需要详细的设计和谨慎的操作。基因表达芯片数据分析一般包括:芯片数据的预处理、寻找差异表达基因、聚类、基因集合分析、转录调控分析以及基因互作网络分析几个环节。其中,通过基因集合分析可以从芯片数据中直接提取反映生物体系功能变化的基因集合,对生物学研究和芯片检测技术的有效使用有重要意义。本文针对这个环节完成了两部分工作:(1)发展了一个基于基因网络拓扑结构中心性的基因集合显著性分析方法---CePa;(2)建立了一个实用的基因集合显著性分析平---CePa在线分析平台。  基于ORA的基因集合分析方法由于使用方便而被广泛应用于实验生物学研究,但分析结果的可靠性尚不令人满意。针对这一问题,本文引入网络结构因素,通过pathway水平统计量计算和网络中心性度量扩展了ORA方法,开发了一个新的基因集合分析方法CePa,用于寻找发生显著变化的生物途径。对实验芯片数据的分析显示,CePa比ORA方法能更有效地发现具有生物学意义的pathway。  本文还开发了一个在线的CePa基因表达芯片数据分析平台,CePa在线平台操作简单,只需进行简单的数据录入即可完成芯片数据的分析工作。CePa在线分析平台由客户端、网站服务器和计算服务器三大模块联合构建而成。客户端负责用户数据的输入和格式验证。网站服务器端负责用户数据的合理性验证以及将合理的数据以任务的形式提交给计算服务器。计算服务器通过队列的形式管理用户任务,利用队列先入先出的特性,对用户任务进行公平的排队计算。同时,计算服务器采用了并行运算的编程策略,通过多进程的形式对正在计算的任务进行多核同时运算,极大的提高了运算速度。R语言出色的绘图功能将用户结果绘制能形象直观的结果图,方便用户的查阅。
其他文献
根对植物的生长具有重要作用,它不仅为地上部提供结构支撑,还是植物吸收营养和水分的器官。植物根系的研究可以加深对植物生长机制的认识,并最终为农业生产提供理论基础。通过筛
合理的无功电压优化控制,是电网安全、稳定和经济运行的基本要求。在电网自动化数据共享、功能整合的大背景下,研发基于标准接口规范的配电网实时无功电压优化控制系统具有十分
Master-apprentice system is a main mode of talent cultivation for Traditional Chinese medicine (TCM).To vigorously push forward inheritance and innovation of TC
平面集成磁件在传统多相交错并联电压调节模块(Voltage Regulator Module简称VRM)的应用使得VRM向着低压大电流和“短、小、轻、薄”的方向发展,然而,平面磁集成VRM中各相磁路之间的磁耦合使得它的工作情况变得复杂,输入与输出之间的耦合给VRM的控制和设计带来了较大的困难。为了研究这些问题以发挥集成磁件的优越性能,文中以三相磁集成非隔离式VRM为研究对象。首先分析了三相磁集成V
高压母线是重要的电力传输设备,随着社会对电力需求的不断增加,常规的矩形母线已不能满足母线发热和短路电动力等方面的要求,逐步被全绝缘母线所替代。本课题根据实际生产需要,针对全绝缘母线在运用过程中出现的问题,研制了一种新型电缆型固体全绝缘智能母线,不仅满足载流量大和绝缘防护性能优良的要求,而且同时通过智能化的检测手段,对母线本体的主要运行参数进行在线监测,保证母线始终处于良好的运行状态。研究成果为长期
学位
随着经济的快速发展,能源需求继续增长,而化石能源是有限且不可再生的,而且化石能源造成的环境问题日趋严重,人类逐渐将目光转移到环保且永不耗竭的可再生能源。风电产业在各种可
学位
据统计,目前我国电力用户停电时间95%左右都是中低压配电网故障造成的。鄂城区的配电系统电压等级为10kV,结构复杂,使用的配电设备种类繁多且规格不统一,电力电缆和架空线路混合分
我国6-66KV配电网多数采用小电流接地方式,这种接地方式具有供电可靠性高等优点。但该系统发生单相接地故障时,由于故障电流小等诸多原因,选线问题一直没有得到很好的解决。本文提出一种根据电压差值做选线判据的方法,提高了耐过渡电阻能力。本文在介绍常用的单相接地故障选线方法的基础上,对故障信号特征进行了分析。介绍了常用的选线方法,指出了这些方法在应用中存在的问题。针对这些问题,本文首先讲述了现有的各种小
学位