论文部分内容阅读
针对真实评测数据中噪声、方言口音、信道噪声、说话随意性等不利因素,本文对声学模型进行了深入地研究:在训练数据中加入背景噪声以增强模型的抗噪声能力;采用基于说话人的倒谱均值方差规整,来降低信道及说话人个体特性的影响;用与待测语音相同地域的朗读和自然口语数据做最大后验概率(MAP)自适应,使模型带有当地方言口音的发音特点并较好地描述自然口语中比较随意的发音现象。实验结果表明,使用这些措施后,待测语音的识别正确率相对提高了44.1%,从而使机器评分和专家评分的相关系数相对提高了6.3%。