论文部分内容阅读
背景: 新生突变(de novo mutations,DNMs)在多种散发性神经精神疾病中起着重要的作用。随着高通量测序技术的发展,测序成本的降低,基于核心家系的全外显子测序(whole-exome sequencing,WES)以及全基因组测序(whole-genomesequencing,WGS)已经成为鉴定DNMs最直接、最有效的方法。该方法已成功在神经精神疾病中得到了应用,主要研究包括:自闭症谱系障碍(autism spectrumdisorder,ASD)、癫痫性脑病(epileptic encephalopathy,EE)、智力残疾(intellectualdisability,ID)、精神分裂症(schizophrenia,SCZ)。到目前为止,已经分析完成了超过3000核心家系的全外显子组或者全基因组样本,筛选到一批候选基因。但是神经精神疾病具有高度的遗传异质性,许多新的候选基因还有待发现。收集这些DNMs,重新分析,能够更有效地筛选候选基因,还能从共表达方面解释神经精神疾病的分子通路和发病机理。另外,开发一个专门存储,浏览,查询,分析神经精神疾病DNMs的数据库具有重要意义,可为后续致病机理的和临床治疗的研究提供参考和依据。 研究目的: 1.准确地注释和分析DNMs,筛选对蛋白质编码有害的突变,鉴定神经精神疾病的候选基因,并给出相应的P值,为候选基因的鉴定提供统计学依据; 2.构建候选基因在人脑中的时空表达网络以及蛋白质相互作用网络,进一步探讨神经精神疾病的分子通路和发病机理; 3.从分子通路以及时空共表达的角度分析神经精神疾病之间的相互关系。 4.搭建一个神经精神疾病DNMs相关的动态数据库,便于用户浏览,查询,分析,可以为后续的研究提供参考和依据。 方法: 1.全面收集和整理基于新一代高通量测序的神经精神疾病(ASD,EE,ID,SCZ)患者以及正常人(Control)的新生突变数据; 2.采用ANNOVAR软件准确注释突变信息,过滤存在公共数据库(dbSNP137,ESP6500,1000Genome,CG69)中的常见突变,筛选稀有突变; 3.使用10款工具和方法(SIFT, Polyphen2_hvar, Polyphen2_hdiv, MutationTaster,MutationAssessor, LRT, FATHMM,GERP++,PhyloP, SiPhy)预测突变对蛋白编码的有害性,以及突变位点的保守型,当≥7款软件预测是保守的或者有害的才视为该突变是“damaging”; 4.计算基因的突变速率、突变数量、外显率,利用TADA模型(Transmission AndDe novo Association)鉴定每一种疾病的候选基因,并给出对应的P值; 5.采用Cytoscape以及自编的Perl程序构建时空共表达网络以及PPI网络; 6.采用PHP,MySQL,JavaScript,HTML等语言搭建动态数据库和网页界面。 结果: 1.已经发表的关文献中,总共从3,183个核心家系中收集到8,166个DNMs,其中3,031个突变位于编码区域,1,181个突变对蛋白编码是有害的; 2.神经精神疾病中发生无义突变、移码突变、有害突变的频率明显高于对照,提示这些突变同疾病的发生有关; 3.根据上面有害突变并利用整合的模型,在4种疾病中,共筛选出39个”strong”,105个”suggested”,487个”positive”,282个”possibly”相关的候选基因。不但鉴定到已知基因,还鉴定到许多新的候选基因。 4.不同神经精神疾病的候选基因在人脑中是时空共表达的,说明这些候选的功能具有一定的相关性; 5.神经精神疾病候选基因富集于四种具有不同分子功能和表达模式的时空共表达模块,不同疾病之间存在明显的特异性和相关性; 6.成功构建一个动态的、实时更新的在线数据库——NPdenovo,用户可以方便地对DNMs进行浏览,搜索和分析。 结论: 1.有害的新生突变在神经精神疾病中具有重要的作用; 2.不同疾病之间存在许多共有的基因,这些基因参与多种分子通路的调控,对多种神经精神疾病发病机制研究具有重要意义; 3.利用神经精神疾病候选基因的在人脑中的时空共表达网络,能够有效地阐明神经精神疾病相关的显著分子通路。