酵母基因表达调控及组蛋白密码的研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:yp0202
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基因表达调控对于理解生物的生长发育规律、形态结构特征和生物学功能极为重要。一个活细胞的复杂功能主要通过许多相关基因及其产物相互作用实现,而这些参与相互作用的基因往往呈现出模块化的协作关系。同时,随着表观遗传学的兴起,作为调节基因表达的主要表观因子一组蛋白修饰以及组蛋白密码问题的研究日益成为表观遗传学的热点。本文主要从这两个方面研究酵母基因的表达:一方面根据基因表达数据利用聚类方法确定基因的共调控模块;另一方面根据组蛋白修饰模式对基因表达产生的影响,利用关联规则算法揭示组蛋白密码。   调控模块通常是指由调控程序所控制的一组基因。确定调控模块的第一个步骤首先要对基因的表达数据进行聚类。由于K-均值、层次等聚类方法都需要输入聚类数目或其它经验参数,无法达到理想的聚类效果。为了解决这个问题,有人提出采用各种验证指标去评估聚类质量的好坏,然后调整聚类数目,再评估,直至达到理想聚类效果。这种方法在聚类数目很少的情况下有效,但当聚类数目很大时这种方法无法实现。根据这种情况,我们提出了一种基于相关系数的聚类方法,在无需输入聚类数情况下,获得了24个具有生物学意义的调控模块,并找出了它们显著的共调控转录因子。以上调控模块建立在数据集全部实验条件下,但有些基因表达只受其中部分条件影响,其中有些条件不起作用,只增加了一定数量的背景噪声。针对这种情况,以往一般采用双聚类的方法,即求出在一定的条件集合下共调控基因集。但其对时序表达数据无法聚类,为此我们提出一种简单有效的基于集合的聚类算法,既能实现对压力数据的双聚类又能实现对时序数据的聚类。   真核基因组由组蛋白包装成染色质,并且它们的化学修饰可以影响基因的表达。组蛋白修饰通常以组合方式起作用,且不同组合对基因表达产生不同的影响。尽管已有多种实验技术和数据分析方法去研究组蛋白修饰,但要在基因组范围内确定组蛋白修饰点之间的关系仍然非常困难。我们基于关联规则挖掘算法提出了一种确定组蛋白修饰组合效果的方法。这种方法首先确定'起作用的修饰事务'(FMTs),然后应用关联规则挖掘算法和统计方法确定组蛋白修饰模式。我们将该方法用于具有8个修饰点的Pokholok数据和具有11个修饰点的Kurdistani数据。我们的方法成功地揭示了基因组范围内两个不同的组蛋白修饰图谱,并且确定了一些由相关文献证实的修饰模式。我们主要关注对基因表达有显著影响的组蛋白修饰组合。提出的方法除了确定已知的修饰模式外,还揭示了许多未知的模式。经过深入分析组蛋白修饰影响转录状态的几种可能的机制,我们推导出三种可能的修饰模式读码机制(‘冗余',‘无关',‘支配')。我们的结果还表明一些修饰模式在人类细胞和酵母之间有很大的相似性。
其他文献
铁路一直都是保障我国经济建设高速进行的大动脉。在我国的经济建设中发挥了不可代替的重要作用。大宗货物的运输都是铁路在承担。例如客运、货运、煤炭、粮食、民用、军用等
LTE系统使用灵活多变的调度配置,提供种类丰富的业务。如何保证对时延和抖动敏感的业务质量(QoS),特别是LTE中基于VoIP的语音服务?如何在不影响系统整体性能的前提下,保证语
最短路径规划问题是一个经典的数学问题,广泛应用于多种与路径规划技术相关的领域。例如:科技领域中的无人驾驶汽车、无人机、智能机器人、巡航导弹打击目标与导弹防御系统;日
近年来随着智能手机的普及,移动设备的硬件水平有了大幅度的提高,甚至在某些指标上已经能赶上或超越低端PC。因而,在这些设备上实现复杂的计算机视觉算法正在变得可能。随着
随着移动通信技术与空间定位技术的发展,以及智能终端的快速普及,基于位置服务得到越来越广泛的应用。私密近邻检测即是基于位置服务中最为普遍的应用场景,用户可以查找位于
随着科学技术的发展,遗传算法(Genetic Algorithms, GAs)在许多领域得到了越来越广泛的应用。然而,目前人们对遗传算法的研究主要以软件实现为主,在速度上受到本质是串行计算
CDMA为提供更好的语音和数据服务经历了多次技术变革。为了提供高速语音和数据服务,CDMA网络纳入了2G/2.5G网络(GSM/GPRS网络)很多新的节点和协议。最新的CDMA20001x EV-DO3G
H.264/AVC是ITU-T VCEG和ISO/IEC MPEG联合共同制定的国际视频编解码新标准,新一代视频编解码标准以较高的编码效率和网络的友好性受到人们的广泛关注。H.264/AVC集中了近些
工业现场数据的采集、记录和分析一直是工业控制中的重要问题。老式的记录仪通常采用机械结构带动纸轴旋转,用记号笔在纸上记录数据的幅值或有效值点。其数据精度低、响应速
无线搜救系统是一种既可用于保障日常训练中飞行员的生命安全,同时也用于战时环境下飞行员在飞机失事跳伞后,搜救飞机同待救飞行员之间进行通信联络的设备。直扩系统由于其强的