肿瘤基因的PCR靶向测序数据分析流程的建立

来源 :东华大学 | 被引量 : 0次 | 上传用户:leec208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高通量测序技术成本持续下降与应用拓展,生物学家愈加倾向使用高通量测序作为解决生物学问题的首选项。高通量测序包括全基因组测序、转录组测序与靶向测序等。靶向测序专门锚定捕获基因组特定区域DNA并进而构建文库与与高深度测序,适用于物种的胚系突变(如遗传疾病)和肿瘤的体突变。靶向测序锚定捕获又分为杂交捕获与PCR捕获两种方法,PCR捕获以通量高、速度快、成本低与生信计算量小备受青睐。前期,本实验室开发了PCR靶向建库方案、测序与数据分析流程,针对肿瘤靶向测序的特殊性,本研究以BRCA与POLE基因为例,揭示肿瘤基因特定分析流程专门化的必要性与重要性。
  目的:本文使用多重PCR靶向测序方法,分别捕获若干家族性乳腺癌患者的BRCA1/2基因(胚系突变)和结肠癌患者的POLE基因(体突变)序列。针对测序数据,构建一个既适用于胚系突变,又可用于体突变的肿瘤基因分析流程,并评估该流程的敏感性和准确性。
  方法:第一,使用ART软件与python脚本,构造人工模拟突变(SNV与indel)测序数据与混合模拟测序数据,分别评估胚系突变与肿瘤体突变基础分析流程的合理性;第二,对遗传性BRCA1/2进行数据分析,综合采用FASTX-toolkit、Cutadpt、BWA与GATK等主流应用软件、使用python与linux构建从接头去除、比对、变异识别的的流程。并对测得6批次BRCAI/2外显子数据变异注释分析;第三,先采用上述流程分析结肠癌患者POLE基因数据、比较胚系与体突变等位基因频率的差异、比较测序深度对肿瘤变异检出的影响并对POLE基因总体突变负荷进行分析。
  结果:(1)模拟结果发现,我们的通用流程对于SNP和INDEL的识别非常灵敏,基本达到100%的正确性;对于低频率突变,在5OX深度下,对10%变异频率的位点,其识别率为60.14%,但是当深度增加到200X的时候,其识别率达到了98.60%,表明增加测序深度有助于对低频率突变位点的识别。(2)对于BRCAI/2基因的分析结果,6批次样本的平均测序深度达到600X以上,数据比对率达到gg.g%以上。在六批次样本中一共calling出64个突变位点(包含重复的),其中4个位点在Clinvar数据库中显示是致病的突变,同时通过多个蛋白质打分软件预测出32363528位置的T>A的突变很有可能是致病位点,而它在Clinvar数据库中被标记为VUS(Variant Uncertain Significace,意义未明突变)。表明该流程适用于胚系突变检测。(3)对于POLE基因的分析结果,深度显著影响变异的检出率,扩增子的平均测序深度达到50000X,可以灵敏识别出5%变异频率的突变位点。106个样本一共检测出10926个SNV的变异,1085个插入变异和1366个缺失变异,SNV突变中共有4421个同义突变,5324个非同义突变。并计算106个样本POLE的突变负荷,其中位数在0.15405。
  结论:本研究构建了一个多重PCR靶向测序测序的pipeline,并使用模拟生成的二代测序数据评估该流程的准确性和敏感性。发现在测序深度足够的情况下(大于200X),该流程对突变的识别率达到90%以上。该分析流程分析速度快,中间操作简单,而且广泛适用于多种不同癌症不同基因的大规模样本研究。同时使用该流程分析了家族性乳腺癌患者的BRCA1/2基因和结肠癌患者的POLE基因。对于胚系突变类似于家族性乳腺癌患者的BRCAl/2突变,研究突变致病性的影响,寻找导致突变的位点,并且比对数据库发现了4个突变会导致乳腺癌的发生,并且使用蛋白质预测软件发现了1个未在数据库中显示的有害突变。而对于体突变导致的肿瘤,寻找一个指标类似于突变负荷来预测癌症免疫治疗的疗效,这有利于精准医学的发展。该流程的开发和优化能够极大推动使用靶向测序数据研究多种不同肿瘤的应用。
其他文献
当前,在世界范围内,乳腺癌仍是女性的第一“杀手”,其发病率和致死率仍处于持续增长中,预计未来几年会显著增加。早期乳腺癌患者是可以通过手术治疗,但术后药物治疗也是必需的辅助手段,是预防癌症复发的主要治疗措施。虽然近些年抗肿瘤药物研发取得了长足的进步,但仍存在副作用大、靶向效果差和药价高昂等弊端,仍需进一步在减毒增效、提升靶向性和降低成本等方面进行优化。  土槿它滨(命名Gamzarpabine,简称
学位
软骨组织工程(CTE)是用于再生或修复由于疾病、创伤而受损的软骨组织的技术,它的基本原理是在体外培养、扩增软骨种子细胞于生物相容性和降解性良好的支架材料上,并在多种信号因子的调节作用下,经过一定周期形成组织工程化软骨的过程。水凝胶(Hydrogel)是广泛用于软骨组织工程的一类支架,含水量高且多孔,可支持营养物质和废物的运输以及传递机械载荷,同时可以将软骨细胞均匀地悬浮在三维环境中,保留其原有的细
经皮免疫通过在皮肤表面外敷抗原和佐剂而诱导机体免疫,是一种极具应用前景的新型免疫方法。本课题组之前的研究表明,基于醇质体(Ethosome,Eth)和蚕丝素(SF)构建的复合纳米纤维经皮肿瘤免疫膜能有效的引发机体免疫应答。为了改善纳米纤维的力学性能并提升载药量,本研究在上述体系中引入聚乙烯醇(PVA)和静电喷雾微球技术,并以甘露糖化聚乙烯亚胺(PEIman)对醇质体进行修饰,构建可靶向树突状细胞(
内质网(Endoplasmic reticulum,ER)是真核细胞内蛋白质、脂类和糖类等生物大分子合成的基地。外界条件干扰导致内质网不能发挥正常的生理功能,使错误折叠或未折叠蛋白在内质网上堆积,引起内质网应激(Endoplasmic reticulum stress,ERS),激活未折叠蛋白反应(Unfolded protein reaction,UPR)应对ERS,以恢复内质网稳态。由ERS引
水凝胶是一种具有三维交联网状结构、含水量高的高分子材料,其具有的类细胞外基质(ECM)性质使其被广泛应用于生物医学领域。其中,可注射型水凝胶因具有微创性和可塑性的优点,近些年来受到了越来越多的关注。  角蛋白是一种广泛存在于毛发中的纤维状结构蛋白,结构上的突出特点是半胱氨酸残基含量高达7~20%。基于其良好的生物相容性,角蛋白水凝胶已被广泛应用于止血,创口愈合以及神经修复等领域。然而,目前报道的角
近年来,由血脂代谢异常所导致的动脉粥样硬化、冠心病等心脑血管疾病已经成为人类生命健康的重要威胁。然而,大量的研究表明,血脂代谢作为一种复杂性状,其表型受到遗传和环境等因素的影响,即个体的血脂代谢除了受到基因的调控外,还受到环境的直接作用以及基因和环境的互作。因此,对血脂代谢相关基因及其环境因素的研究对于预防和治疗血脂代谢异常相关疾病至关重要。  在第二章中,进行候选基因和细胞模型的筛选。通过对课题
学位
目前已经发现30多种能够利用羽毛作为能源物质生长的微生物,但微生物分解羽毛的生理机制尚无明确定论导致微生物降解羽毛效率偏低。分离纯化高质量的天然角蛋白酶以及构建角蛋白酶外源表达菌株并不能显著提高羽毛降解效率。因此,研究野生菌株降解角蛋白过程及具体降解机制是提升角蛋白酶活性的关键步骤。  使用羽毛粉M9培养基培养S.maltophilia DHHJ,羽毛粉作为氮源,SDS-PAGE电泳检测到约为10
性发育是指个体由幼年期向成年期转变并获得生殖能力的过程,该过程的异常将会对人类的生命健康、生活质量带来极其不利的影响。遗传、环境等多种因素都会对性发育的启动产生一定的影响,本实验室前期通过定位克隆的方式在X染色体上发现了一个能够显著影响性发育启动的新基因——miR-505-3p,并在细胞模型和动物模型中验证了其对性发育启动的抑制作用,之后本实验团队对mi R-505-3p的靶基因进行预测,并进行了
学位
DNA序列的插入缺失标记(insertion and deletion),又被统称为indel,是指基因组上发生一定长度的核苷酸序列的增加或删减,是一种重要的遗传变异类型。由于indel在染色体上的分布广泛且密集、遗传模式稳定、多态性强,在法医学鉴定,遗传病诊断,肿瘤检测等领域有着广阔的应用前景。同时,下一代测序技术(Next Generation Sequencing,NGS)的迅猛发展也推动着
学位
海洋油污染是当前世界环境污染中的重要问题,虽然可以通过物理法(吸附、机械拦截)等方法处理大部分重油污染问题。但目前仍缺少具有高效率、高环境亲和性的海洋轻油污染处理方法。另一方面,由角蛋白构成的羽毛、角、毛发等作为自然界最大的氮源废弃物,同时也是一种可以经过多种加工处理方法后再利用的天然资源。羽毛中含有大量的天然蛋白质,随意丢弃不仅会对环境造成污染,也是对天然资源的浪费。  本论文通过从污水处理厂活