论文部分内容阅读
本文探讨生物信息数据平台的开发和病毒蛋白直系同源簇COGs数据库的设计开发问题。本研究利用现有的计算机硬件条件,采用生物信息学中最常用的Linux操作系统,结合高效免费的MySQL数据库数据库系统和Perl等编程工具,开发了一个新的数据库系统平台。该数据库系统主要着眼于双链DNA病毒的基因组数据。目前收录了杆状病毒科(Baculoviridae)、痘病毒科(Poxviridae)、虹彩病毒科(Iridoviridae)、腺病毒科(Adenoviridae)、疱疹病毒科(Herpesviridae)和多瘤病毒科(Polyomaviridae)共6个双链DNA病毒科的基因组数据。
本文开发了针对上述数据库系统的WEB查询、检索界面。为用户提供查询检索服务。直系同源基因的识别在蛋白质功能预测和系统发育分析上有着重要的作用。因此蛋白质直系同源簇(COGs)数据库系统的构建是生物信息学中一项十分有意义的工作。
本文进一步设计开发了一个针对单科病毒的蛋白质直系同源COGs数据库系统。根据COGs数据库建立的一般原理,本研究设计了一种新的算法策略,并结合BLASTP程序和Perl编写的程序为开发工具。利用该系统,本研究建立了上述6个科病毒的COGs数据库,同时开发了相应的COGs检索WEB页面。