论文部分内容阅读
基因表达谱是通过检测细胞内各种mRNA含量来了解各种基因在细胞内的表达情况,从而检测基因表达变化的情况,进而可以反映疾病发生的状态。通过比较不同环境下细胞的基因表达谱,如正常组织与疾病组织、药物的存在与否等,可以发现某种或某些基因在这些过程中起到了关键性的作用,因此表达谱分析在科学研究和临床诊断上有重要意义。目前构建基因表达谱的方法主要有三种:基因芯片、SAGE(基因表达串联分析)以及EST。基因芯片构建表达谱虽然具有速度高和准确度高的优点,但是它只能构建目前已经有基因芯片物种的表达谱,没有基因芯片的物种也就无能为力了。SAGE技术虽然避免了基因芯片的只针对特定物种的缺点,但是它构建步骤繁琐且时间长。而且基因芯片和SAGE的成本都很高,而存储在生物信息数据库中的电子EST是不可多得的研究用例,由此提出根据电子EST来构建电子基因表达谱。
进入后基因组时代,获得大量的试验数据已不是生物信息学家关心的主要问题,利用生物信息学的原理,结合数据挖掘技术对数据的分析是研究的重点和热点,本文即在数据挖掘技术的基础上,结合软件工程原理,充分利用现有网路资源,从各大生物信息数据库中采集相关序列,采用EST策略开发电子基因表达谱构建和分析平台。
通过这个平台可以根据需要构建和分析已有EST数据的物种的电子基因表达谱。论文首先介绍基因表达谱的基本内容、构建基因表达谱常用的方法,以及Gene Ontology(基因本体论)相关原理,并且讨论了数据库系统在生物信息学研究中的所处的重要地位,以及构建电子基因表达谱分析系统所要用到的开发语言、软件开发架构、系统运行环境等。
随后按软件工程项目开发规范,详细阐述了电子表达谱分析系统构建的各个分析设计步骤:需求分析、系统总统设计、详细设计、系统实现,接着介绍系统的使用说明,最后对系统进行验证和评价。在需求分析、总统设计和详细设计阶段采用自上而下、逐步求精的方法进行设计。开发出基于J2EE架构的电子基因表达谱分析系统。
本课题综合了生物信息学原理、软件工程原理和数据库技术以及J2EE架构,开发出一个电子基因表达谱分析系统,对电子基因表达谱分析系统构建所需要的原理、技术和设计的详细步骤进行了相应的实现和探索,为基因表达谱的研究提供了参考。