论文部分内容阅读
基因芯片技术能够获取全基因组表达的大规模数据,但很难利用手工方法筛选出数据中包含的有效信息以及关联不同生物学层面的数据。本文所开发的基因表达热点信息可视化工具是一种能够在染色体上定位显示模式生物基因表达信息的软件。该软件实现了在染色体水平上基因表达变化特征及分布特征的图像可视化,并可获得基因表达热点区域的分布特征数据,从而为在染色体层面上分析基因表达变化敏感区域,推测环境敏感型的转录因子提供有效的帮助。 设计过程的主要工作内容如下: (1)确立了该设计主要由用户界面和与界面上各个功能模块对应的后台程序模块组成。确定了设计的开发环境为Python2.7.5,辅助工具为Matlab R2012a。 (2)准备加载文件。使用MATLAB和Python中的BioPython模块下载线虫六条染色体的基因信息。对本地基因芯片表达数据进行对照处理,对数处理和归一化处理。将下载的信息和归一化处理后的表达数据作为匹配定位的加载信息。 (3)绘制基因表达图像。将匹配定位后的表达信息按照基因在染色体上的顺序在彩色图像中显示出来,用红色或者蓝色的方格代表环境处理后上调或者下调的基因。 (4)统计热点区域基因信息。使用匹配定位后的基因表达数据,统计出特定环境下每条染色体不同表达变化基因的数量和比例,又将染色体上表达连续变化区域的基因查询信息和原始数据导出到文本文件和EXCEL表格文件中。 (5)使用Python中的wxPython模块,设计出了可视化工具的用户界面部分。把界面划分成“下载”、“对照处理”、“生成文件”和“查看文件”四个功能模块。 最后将软件程序打包成脱离编译环境而独立运行的应用程序。经过数次综合调试并加以修改后,系统实现了设计目标,满足了染色体上基因表达信息可视化工具的功能要求。