论文部分内容阅读
本文介绍了一种基于文本分类的语言模型自适应方法.首先.我们用Kullback距离算法将语料文本分类为8个领域,并为每一个领域建立三元语言模型.但试验表明某些领域的语言模型的性能变差.为了解决这个问题,我们试图利用领域语言模型来做语言模型自适应.通过将领域语言模型和综合语言模型进行线性组合,获得了相对于综合语言模型字错误率下降5至9﹪的改进.