论文部分内容阅读
DNA复制是细胞分裂过程的关键步骤,确定DNA复制起始点是生物学研究的重要课题,也是生物信息学研究的热点。目前,绝大多数物种DNA的复制起始点尚不清楚,虽然用生物学实验方法可以确定复制起始点,但具有费用高,工作量大,而且周期较长等缺点。利用生物信息学的方法预测微生物复制起始点,能够加速生物学研究进程,节省资源,以及分析微生物的复制机制。 随着大规模基因组测序计划的不断深入发展,大量微生物基因组序列已被测定,然而只有极少部分细菌的复制起始点是通过实验方法确定的。目前,预测细菌复制起始点的方法主要有DNAWalk、GCSkew、CumulativeSkew和ZCurve,其中前三种方法主要应用复制起始点两侧碱基不对称性来预测细菌基因组复制起始点,但准确性不是很高,ZCurve方法除利用两侧碱基不对称性外,还利用了与复制相关基因位置以及复制起始点附近保守序列信息,但是ZCurve在不同物种间识别方法的运用上具有随机性,没有建立起统一的识别方法。 分析实验确定的复制起始点附近序列,发现细菌复制起始点处的三个显著结构特征,复制起始点两侧碱基分布不对称性,与复制相关基因位于复制起始点附近,复制起始点附近序列具有保守性。本文综合应用这三个特征提出细菌复制起始点新算法。利用本文提出的方法对八个由实验方法已经确定的复制起始点细菌复制起始点进行预测,预测结果与实验结果一致。此外,我们还对1150个未确定的复制起始点的细菌进行预测,预测结果列在河北工业大学理学院生物信息学网站上。 由于古细菌含有一个或者多个复制起始点,因此,古细菌复制起始点识别上一直是生物学上的难题,本文尝试利用上述方法识别古细菌,达到了理想的识别效果。