论文部分内容阅读
文章建立了隐马尔可夫模型(HMM)状态数研究的简单模型,并从信息论的角度出发,对HMM中状态数的选择进行研究,得出HMM信息熵的三个结论,指出了HMM的信息熵由固有熵和附加熵两部分组成,而附加熵又由正附加熵和负重叠附加熵构成。在一定重叠程度下,随着状态数的增加,附加熵逐渐趋向零,从而导致HMM的信息熵渐趋于固有熵。考虑到信息熵的变化趋势,得出语音识别时HMM状态数并非越多越好的结论;指出了汉语单字HMM的状态数取6为宜。