果蝇ChIP-seq、ATAC-seq知识库的建立

来源 :大连医科大学 | 被引量 : 0次 | 上传用户:BlueHeart1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因在不同的器官、组织,不同的发育时期具有表达差异性,致使生命体形成不同的结构与生理功能。在这个过程中,转录因子(Transcription Factor,TF)的调控起到了关键作用。转录因子是指在这种特定空间与时间条件下,能与顺式作用元件特异性结合,可以激活或者抑制基因转录的DNA结合蛋白,又被称为反式作用因子。在转录调控相关研究中,如何定位转录因子与DNA的结合位置,如何预测在不同组织条件下转录因子靶向的基因一直都是研究的基础。随着高通量测序技术的不断发展,越来越多的技术可以用于检测转录因子。本项目中我们收集了果蝇转录因子的多种公共实验数据,采用了科学的方法预测了转录因子的结合位点与靶基因,构建了开源的果蝇转录因子知识数据库,同时开发了相关富集分析R包与网络交互应用等,取得了如下成果。
  第一,通过ChIP-seq和ATAC-seq数据预测转录因子靶基因。我们收集了较大规模的果蝇转录因子数据(截止2019年6月),建立优化的、统一的处理流程,并构建了对应的知识库。用染色质免疫共沉淀测序技术(Chromatin Immunoprecipitation followed by Sequencing,ChIP-seq)、利用转座酶研究染色质可及性测序技术(Assay for Transposase Accessible Chromatin with high-throughput sequencing,ATAC-seq)实验数据来预测转录因子结合位点(Transcription Factor Binding Sites,TFBS)、模体(Motif)与靶基因。从美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)数据库中收集了313个果蝇转录因子的5720组ChIP-seq实验数据与324组ATAC-seq实验数据。首先预测该转录因子在基因组上的结合峰(Peak)位置,之后利用结合峰来预测模体、注释靶基因。基于上述结果构建了果蝇ChIP-seq、ATAC-seq知识库。同时搭建了服务器,设计了前端网页(http://www.drosophila-database.net.cn/)方便研究人员通过多种方式联合、批量查询并筛选预测结果。
  第二,通过靶基因的功能富集分析,为转录因子所参与的生物学过程提供线索。为了定制化的展示富集分析结果,开发了名为ggEnrich的R包,同时开发了该R包配套的Shiny网络交互应用。用户可以通过ggEnrich对自己感兴趣的基因或者转录因子做富集分析,得到一组多个通路或者同一通路多组对比统计图;同时该R包也可以实现以树图的形式展示富集的生物学过程之间的关系,可以计算生物学过程之间的相似性并按颜色将其归类。该R包可以可视化富集分析的结果,使得不熟悉代码的研究人员能够使用简单的输入文件通过快捷的操作得到发表级统计图。
  本研究通过统一的分析流程和科学的方法预测了果蝇转录因子的结合位点、该转录因子对应的模体与靶基因,构建了果蝇ChIP-seq、ATAC-seq知识库。同时探索了转录因子参与的生物学过程,开发了富集分析结果可视化R包与网络交互应用等,这些数据与研究结果为果蝇领域科研人员研究转录调控提供了可靠的数据资源,节约了大量的时间,加深了对转录调控的理解。
其他文献
本文通过个案研究的方法从福柯式话语分析的角度探究了学校规训话语及其权力机制对教师日常生活的影响,研究问题为:(1)学校规训话语如何构建规训权力机制?(2)教师如何在规训权力机制中构建其主体性?(3)学校规训会对教师产生怎样的后果?  作者选择浙江省杭州X中学为研究场所,从2018年3月到2019年1月进行了为期11个月的语料收集,并用福柯的规训权力的微观物理学作为理论框架对收集到的语料进行了质性分
学位
“推陈出新”一直都是所有学科门类谋取长期发展的准则,当代的艺术创作也处在形式创新发展、材料多元化的吐故纳新阶段。而材料作为现代艺术创作中不可缺少的一部分也在随着社会的进步而增加与改变。现在的艺术不仅是描摹物象,而是对当下生活的记录,是对创作者当下真实感受的再现。这能在一定的程度上改变之前一成不变的传统审美习惯,在艺术视觉的层面上丰富观赏者的审美感受,改变他们的审美习惯。传统艺术讲究的是原物的再现,
学位
语言是一个民族和国家的文化基因,是文化赖以生存和延续的基石。2013年以来,随着《汉字英雄》《中国汉字听写大会》《中国诗词大会》等极具影响力的竞赛类语言文化节目的热播,汉语语言文化以一种强势状态登上电视舞台,在当代中国电视史上写下一段佳话。竞赛类语言文化节目的热播是一次现象级的节目创新,背后隐含着丰富的创新传播机理。本研究正是立足于“竞赛类语言文化节目中的文化价值究竟是通过何种传播机制而得以实现的
“互文性”是20世纪60年代由法国女权主义批评家茱莉亚·克里斯蒂娃提出。该理论重点强调“一切文本都是源自其他文本”,并由此产生文本间性。《西游记》作为中华文化的经典著作,一直以来以其魔幻的情节叙事,被影视改编所推崇。西游网络大电影素材来源于经典《西游记》文本,由此该文本与经典西游文本之间呈现出互文现象。近年来,网络大电影成为影视行业的新兴产物,自2014年诞生之日起,西游网络大电影借助经典文本不断
学位
当代喜剧越来越成为时代痛痒和风骚的表达方式,也揭示了当下时代人的内心波澜。“开心麻花”成立于2003年,不断打磨,壮大当代喜剧市场,成为喜剧品牌中的佼佼者。“开心麻花”身在文化消费时代下考量观众需要的是什么样的戏剧,现阶段的艺术作品考量,决不单单只从艺术品的生产和描述表达中决定,市场机制渗入创作领域,戏剧处于一个生产和接受的辩证过程。国内在讨论商业与艺术平衡问题,极少采用观众心理的角度,本文结合社
学位
当前,中国越来越多的城市趋向于建立自身的城市品牌形象,并且人们对日常居住城市的城市品牌形象的关注度也在持续增高,我国很多城市都在往这方面发展,如大连、重庆等。国内一些相关领域的研究学者对这方面的探讨也在不断加深,但是并没有达成一致的认知,也缺乏完善的体系。本文主要是对国内外在上述过程当中取得了较好成绩的城市案例进行深入探讨,分析相应的视觉形象设计是如何与当地文化进行整体融合的,并且对地域文化在城市
学位
维持基因组完整性是将基因组忠实地传递给子代的先决条件。当基因组DNA受到内源性或外源性损伤时,如果未能正确及时地修复,受损的DNA可能导致基因突变或染色体重排。为了保护基因组的完整性,真核生物进化出了复杂且高度协调的网络,以识别和修复DNA损伤,即DDR(DNAdamage response,DNA损伤应答反应)。除了许多蛋白质外,发现ncRNA(non-coding RNA,非编码RNA)也是D
哺乳动物胚胎着床包括胚胎与子宫内膜间的识别、定位、黏附及侵袭等过程,此过程极其复杂而又精细,需要子宫内膜和胚胎在时空上的同步协调,即“着床窗口期”。囊胚和子宫内膜之间的相互作用对于植入是至关重要的。人类早期的妊娠失败通常是由于在胚胎植入之前、植入过程中或植入之的发育缺陷而引起的。  PITX2(paired like homeodomain2,PITX2),是同源结构域转录因子家族之成员,在胚胎发
目的:  O-GlcNAc修饰是单个N-乙酰葡萄糖胺(N-acetylglucosamine,GlcNAc)在蛋白质的丝氨酸或苏氨酸的羟基氧原子上发生的一种单糖修饰。O-GlcNAc基团的添加和移除是由O-GlcNAc转移酶(O-β-N-acetylglucosaminyltransferase,OGT)和O-GlcNAc水解酶(O-β-N-acetylglucosaminidase,OGA)参与
目的:唾液酸化对人胚胎心脏发育和心脏功能有重要的调节作用,研究表明心肌肥厚发生时唾液酸化会进一步增强。唾液酸化的发生需要唾液酸转移酶的参与,研究发现在三种不同基因背景的高血压心肌肥厚大鼠模型中,当基因检测关联到高血压、心肌肥厚与染色体分布时,只有编码唾液酸转移酶7A(Sialyltransfe rase7A,Siat7A)的基因均持续过表达,但Siat7A对高血压心肌肥厚的发生和发展是否有调控作用
学位