基于第二代测序技术的大规模数据生物信息分析

来源 :中山大学 | 被引量 : 0次 | 上传用户:lianxingjiehaha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
第二代测序技术是近20年来生命科学领域最为重要的技术之一。该技术的出现使得从基因组层面通过大数据来分析生物学问题成为可能。目前,随着技术的不断进步第二代测序技术已在多个不同方向上得到应用,例如:全基因组的测序与组装、外显子组测序、基因表达谱分析、非编码RNA测序及分析、可变剪切分析,全基因组甲基化分析以及核小体定位研究等等。与此同时,如此海量数据的产生也使得数据分析变得格外重要,通过数据分析来寻找蕴含在大数据内的生物学规律和意义是我们最终的目的。本研究立足二代测序产生的大规模数据,整合不同来源、不同类型的数据,对数据进行多方位、深层次的解读、分析寻找蕴藏在数据内的生物学规律。研究主要针对遗传学和肿瘤基因组学中的一些基本问题展开,具体包含以下四个方面内容:1,真核生物细胞中核小体结构对DNA序列G+C含量的影响研究;2,转录因子对蛋白编码序列保守性的影响的研究;3,dJ/dS—一种新型检验工具的开发及应用;4,外显子测序技术在神经纤维瘤分子诊断中的应用研究。
其他文献
地震解释是将地震信息转换为地质信息的过程,是地震勘探中的一个重要环节,地震解释的结果直接影响到地震勘探的效益。由于地震勘探技术的不断进步,地震数据的数据量不断增加,地震
该文介绍的基于CORBA辅助开发环境是为了解决ORB编程存在的复杂性、以及与青鸟构件组装工具的集成问题.它包括服务器端和客户端辅助开发工具两个部分.该文的工作主要是客户端
该文主要讨论了ARTs-CS的数据操纵和查询优化的原理与实现,并对其并发控制策略进行了理论上的初步探讨.第一章分别介绍了实时数据库、主动数据库、内存数据库和分布时数据库
该文设计了三种不同的求解生产调度问题的进化算法,基于二进制编码方案的简单遗传算法(SGA);基于解的直接编码表示方案,并借用GT活性调度设计杂交和变异算子的遗传算法(GA/GT
目前,计算机辅助医学图像处理与分析技术已被广泛应用,基于机器学习的医学图像分析技术的研究正方兴未艾,并成为研究热点。已有研究表明,在计算机辅助诊断中,应用机器学习技术对医
该文从应用系统开发的方法论和系统资源管理两个角度进行了详细地分析和论述,进行了应用集成系统的研究和开发,提出了面向应用进行系统分解和设计的基本思路,并进行了初步的
该文主要研究了网络安全的关键技术:防火墙技术?工作员首先提出了防火墙技术参考模型,该参考模型的基本构件是认证功能构件、完整性功能构件、访问控制功能构件、审计功能构
联盟形成问题是多agent领域内的重要课题,当前对其的研究多集中于确定领域,即假设环境是完全信息的,但不确定性是多agent系统的固有属性,能不能有效地解决系统中存在的不确定
目的:我们最近提出了一个预处理交替投影算法(PAPA),以求解SPECT重建的惩罚似然优化模型。该算法是一种崭新的不动点邻近方法。本工作的目的是研究PAPA如何能被有效应用于真实
该论文的背景是开发基于国产开放系统平台COSA/COSIX的Java虚拟机.论文在第一章给出虚拟机的综述,其后的各章结合他们在开发过程中的具体实践对虚拟机的关键技术进行了深入的