论文部分内容阅读
基因间区长链非编码RNA(lincRNAs)已被发现是人类基因组中普遍转录的一类功能性转录本。研究人员已经认识到其在不同生物过程中的多种作用及其与多种疾病有关联的可能性。研究指出,lincRNA基因上的单核苷酸多态可能参与调控人类疾病的发生发展;表型相关的功能性SNP可被映射到基因间区长链非编码RNA的区域上,从而阐明了一些致病机制。另一方面,lincRNA的异常表达也能够影响某些疾病的易感性。最近的研究指出,lincRNA启动子区域上转录因子结合位点的遗传突变是导致lincRNA表达异常的原因之一,进而成为影响疾病发生发展的因素。本研究针对人类基因间区长链非编码RNA这一新型转录产物,研究影响其疾病相关性及可能导致其表达丰度异常的遗传变异。本研究开发了两个公开的网络数据库LincSNP和SNP@lincTFBS,分别针对lincRNA区域上表型相关的SNP和lincRNA启动子区域转录因子结合位点上的SNP的整合和识别,并将SNP进行全面的功能注释。本研究灵活的查询平台和便捷的结果获取将为进一步研究lincRNA的功能及其在疾病中的作用提供方向性预测和先导,为实验室验证实验提供原始数据资源和相关候选数据。 当前版本的LincSNP数据库从多个全基因组关联研究数据源和人类表型相关数据源整合了超过150万个疾病或表型相关的SNP及其链锁SNP,涉及五千多个lincRNA,大约十四万个疾病或表型相关的SNP可被映射到lincRNA区域上。此外,本研究对全部获取的疾病或表型相关SNP进行了目前最全面的功能性信息注释,包括:基本信息、基因组信息、进化信息、基因共表达信息和相关疾病或表型信息。SNP@lincTFBS的当前版本包含8000余项SNP-TFBS-lincRNA关联信息条目,涉及5,835个lincRNA、6,665个SNP和164个转录因子。公开的网络数据库均提供灵活的查询和下载功能。