中英文混合语音合成系统

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:nev0618
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音合成技术是人机语音通信的重要组成部分,基于此开发的产品涉及到人类生产生活的很多方面。随着信息化程度的提高,国际交流的频繁尤其是互联网的发展,不同语言之间的交流越发重要,越来越多的多语言混合应用开始涌现。在生产生活中,我们经常遇到在中文句子中混合有英文的名字,专有名词,或者某些习惯用语的情况。因此,实现多语言混合语音合成是语音合成技术广泛应用的必要环节。   本文的研究工作包括:   开发了基于波形拼接技术的英文语音合成系统,对各模块使用的关键技术进行分析和探讨。使用二元语法模型进行词性预测,最大熵模型进行韵律短语边界预测,讨论了英文语音合成的基本单元及其优缺点,考虑了使用中文语音合成系统中成熟的韵律预测方法进行英文韵律预测的效果。声学模块给出了目标代价和拼接代价的考虑因素和计算方法。   详细分析了中文和英文的区别,这些区别是中英文混合合成系统设计和开发的难点和要点所在。分析了在中英文混合语料中中文和英文的相互影响,包括两个方面:一个是中文声调和英文重音的关系,第二是中文和英文在韵律上的相互影响。基于分析结果,提出了针对嵌入在中文上下文中的英文的韵律调整模型,包括时长调整模型和基频调整模型,从而产生自然度高的混合韵律。   构建了中英文混合语音合成系统,在实现过程中,主要关注了中文合成系统和英文合成系统的融合,增加了韵律调整模块,并且针对一类常见中英文混合现象-中文句嵌入字母词,提出了有效的解决方案。
其他文献
国内应用的大部分工业机器人系统采用的是封闭结构的专用控制器,所能完成的作业任务比较单一,并且缺乏对外部环境和作业对象的自适应能力,不能满足制造业对机器人系统可靠性、可
学位
倒立摆系统是一个典型的多变量、非线性、严重不稳定系统,许多抽象的控制理论概念都可以通过倒立摆实验来直观的表现出来。对这样一个复杂系统的研究,从理论上将涉及系统控制中
磁共振成像(Magnetic Resonance Imaging, MRI)技术是一种先进的医学诊疗手段,不仅能够获得任意部位、任意方位的组织切片层图像,而且具有多个可调参数,因而在显示病灶区域的
射频识别(Radio Frequency Identification,RFID)技术,是一种利用射频通信实现的非接触式的数据采集和自动识别技术(以下通称RFID技术)。而超高频射频识别技术(Ultra High Freq
两栖机器人是一种既可以在陆地、滩涂上行走,又可以在水中浮游的特种机器人,具有陆上步行机器人的行走能力和水下机器人的水中航行能力。足板驱动两栖机器人的研究是在轮桨腿一
近代工业逐渐向大型、集团化发展,一些大型、高能和高速的工艺和设施越来越多,各类工程系统的复杂性大大增加,工业生产领域中低概率重大事件的事故发生频率相对明显增加,系统的可
水下传感器网络系统集成了无线传感器网络与水下机器人技术的优势,为解决水环境监测、水下探测等领域面临的监测数据有效实时回收问题提供了新思路。但是,水声通信的诸多限制使
学位
在公路交通快速发展的时代,疲劳驾驶已成为引发交通事故的主要原因。因此,如何快速、准确的识别驾驶员的疲劳状态已成为世界各国研究的热点。而机器视觉理论及其在人脸检测领域
受现代军事技术发展的客观环境的影响,在信息化条件下的战争,对精确打击提出了更高的要求。如何提高弹箭武器射击精度已成为愈发重要的课题。研究通过判断待打击目标的具体位
学位