论文部分内容阅读
背景: 癫痫是当今世界上最盛行的慢性神经功能障碍之一,在1000个儿童中就有3.5-6.5个儿童患有癫痫,并且在同样数目的老年人中就有10.8个老年人深受癫痫发作之苦。由于其发病年龄跨度之大——从婴儿到成人,癫痫有多种多样的临床表型,比如婴儿痉挛、儿童失神性癫痫、青少年肌阵挛性癫痫等。在过去二十年中,研究者们已付出巨大努力致力于癫痫遗传易感性的研究,大量的基因和突变也因此而被发现与该疾病相关。尤其是在过去两年里,随着高通量测序在医学遗传学领域里的广泛应用,癫痫致病基因的查找已取得巨大成功。然而,与其他针对具体疾病而构建的数据库相比,如自闭症领域里的AutismKB和注意力不集中症领域里的ADHDgene,癫痫领域里整合并分析了各文献中与癫痫相关遗传数据的数据库仍处于起步阶段。 目的: 1.全面收集与癫痫各临床表型相关的基因和突变,并详细地注释这些信息。 2.构建一个综合的数据库,该库在整合上述信息的前提下,进一步分析收集而来的数据,研究癫痫相关基因的生物学功能,以及癫痫与自闭症谱系障碍、智力缺陷、精神分裂症、注意力缺陷/多动障碍等四类疾病的共患病现象。 3.构建基因-疾病网络图,展现基因(或疾病)间共同相关联的疾病(或基因),帮助研究者们理解癫痫复杂的临床表型和遗传模式。 方法: 1.根据关键字搜索从PubMed中搜集癫痫遗传学相关文献,并从中收集基因名、突变信息、临床表型等遗传数据,以及发病年龄、性别、种族等临床信息。 2.采用Perl脚本把从文献中收集而来的突变数据转成ANNOVAR要求的格式,尤其是将突变在编码区上的坐标(如NM_012469,c.2185C>T)转化为在基因组上的坐标(如chr20:62658491)。 3.采用ANNOVAR注释所有癫痫相关突变,注释信息包括突变在对应基因上的区间、突变效应、在千人基因组中的频率、是否存在于dbSNP数据库等。 4.采用WebGestalt注释所有癫痫相关基因所富集的GO、通路、蛋白相互作用网络等,根据从BrainSpan下载的人脑表达数据注释所有癫痫相关基因的脑表达水平,并根据从NCBI下载的人类基因信息注释所有癫痫相关基因的基本信息。 5.优化癫痫相关基因,并将优化所得的高可信度基因进行共表达、表型富集等功能分析。 6.分别从AutismKB、HGMD、SZGR和ADHDgene等四个疾病数据库收集与自闭症谱系障碍、智力缺陷、精神分裂症和注意力不集中症相关的基因,再与癫痫相关基因进行比较分析以便找出共有的基因,并基于以上共有的基因进行表型富集、通路富集等重叠分析。 7.基于SVG开发基因-基因网络图,疾病-疾病网络图以及基因-疾病网络图。 8.基于MySQL+PHP构建EpilepsyGene数据库存储以上信息,并基于HTML+CSS+Javascript开发一个支持多样化浏览、查询数据的直观的网页界面。 结果: 1.共从818篇文献中收集499个基因、3931个突变、331种临床表型等。 2.已构建一个综合的遗传数据库——EpilepsyGene(http://61.152.91.49/EpilepsyGene),整合并注释了癫痫领域日益增长的遗传数据,可向研究者们全面地展现癫痫研究的前沿。也已搭建一个直观的网页界面以支持多样化的查询、浏览,进而获取感兴趣的数据。 3.基因优化共得154个高可信度基因。经共表达分析这154个基因被分为蓝色、绿色、棕色、灰色等四个共表达模块。通过进一步的功能分析发现绿色模块的基因富集于离子转运这一功能,并且该类基因的脑表达水平从怀孕后8周开始呈现递增状态。 4.EpilepsyGene数据库中有65个癫痫相关基因被发现是与MR共有的(以下简称MR-EP基因),18个与ADHD共有的(以下简称ADHD-EP基因),67个与SCZ共有的(以下简称SCZ-EP基因),146个与ASD共有的(以下简称ASD-EP基因)。经进一步的富集分析发现,MR-EP基因和ASD-EP基因共有的癫痫临床表型数目最高,达86种之多。这或许能解释为什么同时患有自闭症和智力缺陷的人患癫痫的概率那么高。此外,还发现四类共有基因都富集于‘神经活性的配体-受体相互作用’这一通路,且该通路在ADHD-EP基因、ASD-EP基因和SCZ-EP基因等所富集的通路中都排在第一位。由此表明,或许正是由于参与此通路的基因发生了突变,才导致了癫痫与其他三类神经精神类疾病的共患病现象。 结论: EpilepsyGene是一个全面综合有序的资源,整合并注释了从818篇文献中收集而来的499个癫痫相关基因、3931个癫痫相关突变、331种临床表型以及相关的临床信息。此外,EpilepsyGene也是癫痫领域第一个探索癫痫与其他神经精神类疾病共患病现象的数据库。与ASD、MR、SCZ和ADHD共有的基因在EpilepsyGene数据库网页中也被分开展示。同时,基因-疾病网络图的开发使得展示两个基因(或疾病)间的关联成为可能,从而便于分析癫痫复杂的临床表型和遗传模式。总而言之,支持多样化的查询、浏览功能,EpilepsyGene将作为癫痫领域主要的遗传数据库,帮助研究者们揭示癫痫复杂的遗传模式。