论文部分内容阅读
在语音识别的研究中,如何充分利用汉语固有的特点一直是一个重要的研究课题。汉语是一种有调语言,音调里包含了丰富的语意信息。另外,汉语的音节是由声母加韵母组成的,声母的发音时间只是韵母的几分之一。根据这些特点,他们尝试通过引入音调特征和时域非线性变换来提高对汉语的识别率。具体地对传统的基音提取方法做了一些改进,并为音调特征建立了高斯概率混合模型以便与HMM模型相结合。对声母和韵母采用了动态时域非线笥变换。实验证明这些方法对弧立数字的识别水平有一定程度的改善,对连续语音的识别也有相当的指导意义。