汉语语音合成中的韵律结构预测及自动标注研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:forbj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音合成技术是实现人机交互的关键技术之一,具有广阔的应用前景,其发展目标是合成出清晰,自然,有表现力的语音,而韵律分析则是实现这一目标的基础。本文的研究内容在于探讨和解决拼接式语音合成系统中的两个重要问题,即如何基于文本对韵律结构进行自动预测以及如何对语音库进行自动韵律结构标注。重点研究了语法信息尤其是句法结构对韵律结构预测的作用。 文中首先对韵律结构、语法、语音声学参数之间的关系进行探讨和归纳,明确了研究的理论基础,并对韵律结构预测与自动标注方法进行探讨。 构建了一个基于句法结构标注的实验数据库。为了着重研究句法对韵律结构预测的贡献,本文从带有句法结构标注的语料库—清华树库中精选了部分语料用以录制语音,并对其进行韵律结构、声学参数的标注。 研究了语法,包括词法、句法信息对韵律结构预测的作用,并比较了最大熵和决策树模型在结构预测中的性能。实验结果表明在传统的以词法信息为特征输入的基础上引入句法结构信息对提高韵律结构预测的正确率具有显著的贡献,同时实验结果还表明最大熵模型比决策树模型在韵律结构预测方面具有更好的性能。 实现了利用声学参数特征对语音的韵律结构进行自动标注。本文分析提取了有用的声学参数特征,包括音节时长、能量、基频等并结合前面用到的语法信息,利用C4.5决策树的方法,对语音库进行自动韵律结构标注。实验结果表明韵律词边界和短语边界都达到了非常理想的标注结果。
其他文献
近年来,随着北京地铁跨越式发展,列车运行速度不断提升,列车线路越来越长,对地铁信号设备质量以及维护管理水平提出了更高的要求。随着地铁向高速化方面发展,势必对转辙机控制电路
竹类植物神韵挺秀、潇洒飘逸、风雅宜人,集文化、美学、景观价值于一身,是构成中国园林的重要元素。在中国古典、近现代及现代园林中均广泛应用。本研究定量和定性相结合,平行比
本文通过对荣华二采区10
期刊
无线技术的飞速发展,使得移动通信已经进入了以码分多址接入(CDMA)技术为基础的第三代, 使得第三代移动通信网络(3G)具备了高速数据传送能力,其所支持的业务也由纯粹的数字业
IEEE802.15.4标准是构建低速无线个域网的新技术之一,它不仅具有低成本、低功耗、低速率、低复杂度的特点,而且具有可靠性高、组网简单灵活之优势,主要适用于短距离、低速率的数
随着计算机和通信技术的迅猛发展,全球信息网络正在快速向以IP为基础的下一代网络(NGN)演进,结合未来全球个人多媒体通信的全面覆盖要求及下一代宽带无线(NGBW)的概念与发展趋
SOS应答系统普遍存在于细菌,是受到RecA-LexA调控的一种低保真度DNA修复方式。在正常状态下,阻遏蛋白LexA二聚体结合在细菌SOS应答基因的启动子区域,抑制基因表达;当细菌处于
为深入贯彻落实习近平新时代中国特色社会主义思想,全面贯彻党的十九大、十九届历次全会、中央经济工作会议精神,认真落实全国交通运输工作会议精神,总结2019年珠江水运改革
期刊
摘要:对于作文素材的积累与使用就是当前高中生最为关注的一种学习方式,文中对作文素材的积累和使用进行了深入探讨。通过分析总结认为素材的积累与使用是提高汉语文作文写作水平的最佳方式,并针对性提出了加强素材积累和使用的有效措施。  关键词:高中汉语文;作文素材;积累与使用  随着教学方式的不断改革,很多高中语文课堂的教学方式也得到了很大程度的改变。对于高中生的教学重点也不仅仅限制于专业知识的教学,而是慢
移动通信越来越广泛地渗透到每个人的生活当中,人们对各种业务的需求的增加,促进了移动通信的飞速发展。其中,集群通信系统具有组网灵活、智能、网络管理高效和专用型的特点,有着