论文部分内容阅读
在人类cDNA序列确定全长基因的过程中,必须判断第一个ATG密码子是真正的起始密码子还是框内的非起始作用的甲硫氨酸密码子,在总结了这二类密码子上下文共有序列特征,周期性,密码子的碱基偏向性,以及编码的氨基酸的疏水性等方面差异的基础上,从模式识别的角度出发,将这二类密码子视为由此构成的多维特征空间中的二个模式类,应用费歇线性判别法进行分类器的设计,并对分类器的错误率进行估计,表明在这些特征下,这二类密码子可以区分,以此分类器的判断真正的起始密码子和非起始甲硫氨酸密码子,其准确率可达75%。