影响全基因组测序数据质量-AT分离因素的研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:zsdown520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全基因组测序(Whole Genome Sequencing,WGS)是对未知基因组序列的个体进行基因组的测序和分析的常规技术。基因组信息对于鉴定遗传性疾病、表征驱动癌症进展的突变和追踪疾病爆发极为重要。基于全基因组重测序的人类遗传学和群体进化学的研究,可以快速的实现基因组多样性分析,遗传进化分析,致病和易感性基因等变异基因的筛选。目前,全基因组学测序主要是使用二代测序仪进行测序,从样本的提取、建库、测序每一个环节都会影响测序数据的质量和产能,而测序数据质量将影响下游信息分析的结果,因此,获得高质量的数据是生物信息分析全面,正确的前提。AT分离是测序数据质量监控的一个关键点,AT分离的结果可能会影响到下游生信分析的变异检测和CNV分析,同时,也可能会导致一些高GC区域的覆盖度偏低,减低高GC区域的位点分析准确性,或无法分析微卫星位点信息。虽然AT分离偏大或偏小对生信分析的影响不大,但为了将这种影响降低至最小,我们对这个指标的影响因素进行了分析并优化,确保更好的保证测序数据的准确性和可靠性。本文采用华大自主研发的测序仪(BGISEQ-500、DIPSEQ)进行WGS文库的测序,并对测序数据进行了分析,发现了影响测序数据AT分离的4种因素,并通过实验进行优化,降低了测序数据的AT分离,从而提高了测序数据质量。结果如下:(1)DNB(DNA nanoball,DNA纳米球)浓度对测序数据AT分离有影响,DNB浓度越高,AT分离越大。DNB浓度在12-20 ng/μL时,测序数据的质量最好,AT分离情况比较小;当DNB浓度<8 ng/μL时,测序数据的质量最差;(2)文库建库方式对测序数据AT分离有影响,通过优化了建库方法,在文库构建后增加酶切反应,并对文库进行定量;同时优化了测序方法,在DNB制备环节,将文库投入量由15μL改为6 ng,方案优化后,分析1421个样本的测序结果,发现方案优化可有效降低测序数据AT分离的情况;(3)文库投入量对测序数据AT分离有影响,通过优化实验方法,在DNB制备环节,将文库投入量由6 ng改为4 ng,在BGISEQ-500测序平台上,比对了3820个样本的测序结果,发现可有效降低测序数据AT分离的情况,但在DIPSEQ测序平台上,比对了65个样本的测序结果,发现效果不明显;(4)X酶对测序数据的AT分离有影响,通过优化实验方法,将X酶浓度定为75 ng/μL,在DIPSEQ测序平台上,分析了79个样本的测序结果,发现可有效降低测序数据AT分离的情况。总之,本研究优化了实验方法,通过实验测试后,发现可有效降低全基因组测序数据的AT分离情况,并将方法应用到生产中,最终测序数据的AT分离情况得到了有效的降低,从而极大地提高了全基因组数据质量,为后续数据分析提供夯实基础。
其他文献
中国煤层气资源丰富是我国煤矿资源储量的显著特征,为充分利用我国的煤层气资源,近年来中国政府加大了对煤层气开发技术的研究力度。在国际能源形式日趋紧张和环保意识不断增强的今天,如何安全高效的对煤层气资源进行开采是一项艰巨的任务。其中钻井扩孔的控制是煤层气开采过程中的关键技术,它直接影响到开采是否成功。本文以基于煤层气开发自动化控制系统为研究对象,设计了PLC和组态王的过程控制系统,采用上位机和下位机的
矩阵在各个学术领域和重要课题中已经占据着不可代替的作用.计算机在数值计算方面,矩阵计算需要花费大量时间,同时矩阵理论在计算数学、统计学、控制理论等领域中也有重要的
作为一种新型的手性Br?nsted酸,手性磷酸在很多不对称催化反应中,均表现出优异的手性诱导能力,其分子内含有Br?nsted酸性位点和Lewis碱性位点,是一种双功能催化剂。目前的研究主要集中在联萘酚衍生的手性磷酸,而联萘酚手性骨架3,3′-取代基的引入程序复杂,成本高昂,因此有待开发出新型的、廉价易得的高效高立体选择性的手性磷酸。本论文基于本课题组前期工作,设计合成了一系列酒石酸衍生的双羟基手
转化生长因子-β2(TGF-β2)对免疫应答有全方位的负调节作用,可调节几乎每一种适应性免疫应答和固有免疫应答的细胞,包括树突状细胞、T细胞、B细胞、粒细胞和固有免疫淋巴样
近年来,随着互联网行业的不断发展,越来越多的开发人员在以Git Hub为代表的项目托管平台上进行自己的软件开发工作,同时越来越多的研究人员开始通过分析Git Hub上的开源代码仓库研究软件开发相关问题。例如:软件开发团队中的社会多样性、Pull Request持续时间预测、commit与issue之间的关系预测、开发人员性别对于Pull Request接受率的影响等。在项目版本控制系统中存在着许多
近年来随着制作工艺的进步,人们可以制作出微纳米量级的光学器件。一些基于表面等离子体激元和局域表面等离子体的金属纳米结构(主要是纳米光学天线)具有突破衍射极限的能力。通过使电磁辐射集中到亚波长尺度以产生极强且高度局部化的电磁场(称之为热点),引起了众多科研工作者的关注,并试图探索这种现象的潜在应用。这种光学性质为研究者们提供了一种可以在纳米尺寸内操纵光的方法,并且该方法仅仅受到金属纳米结构自身的形状
啁啾长周期光纤光栅(CLPFG)有很多优点,是目前发展迅速的一种光纤无源器件。传统的光纤光栅制作方法制作得到的啁啾长周期光纤光栅,其啁啾系数、滤波效率等都是固定的。机械制啁啾长周期光纤光栅(MCLPFG)能够克服传统制作方法的缺点,可用来实现制作简单、调谐方便、成本低廉以及可重复构造的CLPFG。本文主要对MCLPFG进行了研究。论文首先利用机械装置使周期性的V型槽对光纤施加压力,得到了一种机械制
滑坡具备范围广、发育多、危害巨大等特点,对桥梁、道路及其他设施破坏力非常大,使广大人民的人身及财产权益处于巨大隐患之中。如何快速、全面地识别及提取滑坡分布特征、性质、规模等信息具有十分重要的现实意义和科学意义。目前,遥感技术的发展为滑坡的识别及提取提供了新的方向,遥感影像已被用于滑坡灾害防治的各个环节之中。可是基于遥感影像的滑坡识别方法主要针对地震型滑坡,不能完全对小型、降雨型滑坡适用。且以往的研
随着金融行业客户服务竞争的加剧和金融科技战略布局的深入,需要借助现代化的信息技术来提升资讯服务水平,增强用户的粘合度,并提高资讯工作者的工作效率。券商资讯平台在原有的传统资讯服务的基础之上,整体采用微服务架构,并结合机器学习算法,持续为用户提供精准、便捷的资讯服务。本文基于以上背景,首先介绍了本文选题的来源和项目背景,论述了国内外相近行业的研发现状,确认了项目的实际意义;其次,介绍了相关技术,对系
现有的推荐方法尚未涉及到查询数据的处理问题,不仅没有考虑用户的个性化需求,也没有很好地对资源的特征进行细化研究,使得检索效果一般,很难满足用户需求。本论文以群组推荐