基于BLSOM的人类与小鼠基因组隐藏序列特征对比

来源 :东北大学 | 被引量 : 0次 | 上传用户:Cgsking
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在哺乳纲中的实验动物里,小鼠因为其形体小,饲养和管理非常方便,也非常易于控制,且小鼠的生产和繁殖能力强,人们对其研究最深,已有明确的质量控制的标准,现在在实验室中拥有大量的近交系、突变系和封闭群,所以在各种实验研究中,小鼠的用量最大,且用途最多。因此,对于人类和小鼠的基因组隐藏序列的特征对比非常具有现实意义。  作为一种无监督的神经网络算法,自组织映射(SOM)是一个能够在一个单一的二维图上,进行高维复杂数据的聚类并且将其可视化的有效工具。但要能够进行在物种之间进行大量的基因组序列的特点的广泛对比,就需要改进自组织映射的算法。我们采用批处理自组织映射作为研究手段,进行人类与小鼠基因组隐藏序列特征对比。  在这篇论文中,我们首先使用十种脊椎动物的基因组的100-kb的序列片段构建批处理自组织映射在五核苷酸组合物上进行聚类,以检验批处理自组织映射在五核苷酸组合物上聚类的可行性。十种脊椎动物在批处理自组织映射上的成功聚类,说明了批处理自组织映射在物种基因组序列中能够识别物种特异性的特征(寡核苷酸频率的关键组合)。在整个批处理自组织映射的学习过程中,只允许基因序列本身的物种特异性特征,除此之外,就没有带有任何别的与物种本身有关的信息。因此,批处理自组织映射的分类和可视化的能力都是非常强的,它能够从大量的基因组序列中提取广泛的信息内容。  然后,我们再利用批处理自组织映射在五核苷酸组合物上对来自人类和小鼠基因组的100-kb的序列片段进行聚类,利用基因组序列中的单核苷酸个数,进行比较,找出人类基因组和小鼠基因组在五核苷酸组合物上的不同之处。在利用批处理自组织映射对比人类和小鼠的基因组,发现在诸如五核苷酸组合物AAATT/AATTT,ATCAC/GTGAT和TTCAA/TTGAA上有很多的不同。并且通过观察二维图,发现一些特殊区域,这些特殊区域分布于染色体着丝粒和附近区域,通过验证位于特殊区域的序列与转录因子相关。
其他文献
换能器带宽的增大以及信噪比的提高是医学超声成像质量的基础。在保持一定的灵敏度的前提下,提高系统的带宽,从而提高成像分辨率,是目前医学换能器研究的焦点。论文采用了楔状结
春节前夕,北京市各级党组织为流动党员送上了特殊的礼物:颁发了《中国共产党流动党员活动证》《流动党员教育管理工作文件选编》小册子,有的还赠送了学习书籍;市委组织部和各
科学可视化是发达国家20世纪80年代后期提出并发展起来的一个新的研究领域,它将大量抽象的数据用图形或图像直观地表示出来,应用领域十分广泛。医学图像可视化属于其一个研究
南京十八频道是南京广播电视集团八个频道中的一个综合频道。AC尼尔森统计数据表明,十八频道观众的文化层次、收入水平在南京地区电视节目排名中名列第一,老、中、青观众各占
彭雪枫(1907—1944),河南镇平人,1926年加入中国共产党,是中国工农红军和新四军杰出的军事家。彭雪枫文武双全,率军南征北战,麾下部队屡为前锋,战功赫赫。他参加过第三、四、
心血管疾病是工业化国家的首要死亡原因,一直是危害着人类的健康。医用超声成像具有很多优点,比如无创性、实时性、廉价性、可重复性好、灵敏度高等特点,广泛使用在诊断心脏疾病
学位
自从人类疾病网络的概念提出以来,它已经成为发现疾病与疾病间联系的一个有力工具。越来越多的研究表明,共享相似或相同疾病表型的基因更可能编码相互间发生互作的蛋白质。因此
在“互联网+”的大背景之下,高职在进行行业英语教学时,也应该进行教学模式的创新和改革,尤其是当下高职的行业英语教学过程当中存在的一些问题和不足,难以培养学生们的行业
随着“互联网+”时代的到来,高职大学英语教学改革迎来了新的机遇,混合式教学模式应运而生.文章阐述了混合式教学的内涵,分别从重新定位师生角色、重构英语教学设计和建立形