论文部分内容阅读
本文目的在于通过文本挖掘技术,构建成脂分化分子调控网络数据库,并搭建在线的数据查询和分析平台,促进成脂相关的关键基因和通路的发现。本文研究方法为以下三步:其一,文献信息的采集与挖掘。以47个与成脂分化调控相关的关键基因与“adipo*differen*”作为检索条件,提交到PubMed;检索得到9908篇文章摘要被作为初始语料库用于进一步分析;运用文本挖掘的方法,通过Cytoscape数据分析平台构建初始的成脂分化调控因子互作调控网络;其二,人工筛选,注释和分析。专业人员根据文献摘要对特定基因,microRNAs和它们之间的关系进行检查和筛选;在成脂分化调控网络中进行标记;结合整个数据库平台的互作关系数量、表达记录数量和靶标预测数量,统计计算出每个节点的IF值,定量表示节点对成脂的重要性;通过PAZAR、TRRUST和miRGate收集了所有可能与成脂相关的转录因子和miR的预测靶标;其三,信息的储存与可视化。基于Microsoft SQL Server关系型数据库平台开发ARN数据库;基于.NET和HTML5开发Web界面;通过D3(d3js.org)实现成脂调控网络的可视化;其四,基于用户的多种筛选和分析需求,设计专业分析工具。本研究构建了一个成脂分化分子调控网络数据库(URL:http://210.27.80.93/am/)。截止到2016年5月25日,共收集到与成脂相关的3054个节点,1807条互作关系,10675条表达记录,并通过miRGate、PAZAR和TRRUST等数据库确定了12696条可能存在的靶向调控关系;二是将节点和文献信息添加到成脂分化调控网络中,实现了复杂网络信息的可视化呈现。三是基于数据库平台的所有数据,为用户提供了一个成脂分化分子调控的专业分析工具。ARN数据库的数据和文献信息整合自6个公共数据库,ARN平台是一个简单快捷的在线检索分析工具,通过为成脂分化领域的研究人员提供多样和专业的信息,促进关键基因和通路的发现。