论文部分内容阅读
语音合成技术是人机语音通信的重要组成部分,基于此开发的产品涉及到人类生产生活的很多方面。随着信息化程度的提高,国际交流的频繁尤其是互联网的发展,不同语言之间的交流越发重要,越来越多的多语言混合应用开始涌现。在生产生活中,我们经常遇到在中文句子中混合有英文的名字,专有名词,或者某些习惯用语的情况。因此,实现多语言混合语音合成是语音合成技术广泛应用的必要环节。
本文的研究工作包括:
开发了基于波形拼接技术的英文语音合成系统,对各模块使用的关键技术进行分析和探讨。使用二元语法模型进行词性预测,最大熵模型进行韵律短语边界预测,讨论了英文语音合成的基本单元及其优缺点,考虑了使用中文语音合成系统中成熟的韵律预测方法进行英文韵律预测的效果。声学模块给出了目标代价和拼接代价的考虑因素和计算方法。
详细分析了中文和英文的区别,这些区别是中英文混合合成系统设计和开发的难点和要点所在。分析了在中英文混合语料中中文和英文的相互影响,包括两个方面:一个是中文声调和英文重音的关系,第二是中文和英文在韵律上的相互影响。基于分析结果,提出了针对嵌入在中文上下文中的英文的韵律调整模型,包括时长调整模型和基频调整模型,从而产生自然度高的混合韵律。
构建了中英文混合语音合成系统,在实现过程中,主要关注了中文合成系统和英文合成系统的融合,增加了韵律调整模块,并且针对一类常见中英文混合现象-中文句嵌入字母词,提出了有效的解决方案。