基于词类-音节数序列的汉语语句韵律结构预测研究

来源 :北京大学 | 被引量 : 0次 | 上传用户：ddall

【摘要】

：

语句韵律结构自动预测是汉语文语转换中非常重要的一项内容，直接影响合成语音的自然度。本文第一次成功构建了完整而清晰的基于词类-音节数序列的语句韵律结构预测系统。这一

【作者】

：

裴雨来

【机构】

：

北京大学

【出处】

：

北京大学

【发表日期】

：

2009年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语句韵律结构自动预测是汉语文语转换中非常重要的一项内容，直接影响合成语音的自然度。本文第一次成功构建了完整而清晰的基于词类-音节数序列的语句韵律结构预测系统。这一基于词类-音节数序列的语句韵律结构预测系统，全部输入信息只有语句的词类-音节数序列，输出为包含音步结构、停延段结构的语句韵律结构。根据这一系统，音步结构预测正确率达95％，停延段结构预测正确率至少达81％，效果已达到甚至超越基于大规模语料库训练所构建的统计预测模型。　　在构建系统的过程中，我们提出了全新的语句韵律结构生成分析模型--线性语法关系基础上的韵律特征核查操作模型，简称韵律特征核查模型，这一模型是整个预测系统的基础。韵律特征核查模型的全部输入信息为计算机非常容易获得的词类-音节数序列，输出为语句的韵律结构。相较前人的模型，这一模型真正系统、清晰地说明了语句韵律结构的生成过程。另外，这一模型不只适用于本文，同样也适用于基于统计的预测系统。　　模型具体内容如下图所示：　　整体来看，韵律特征核查模型分为两个组成部分：由②、③、⑩构成的特征核查操作；以及由④、⑤、⑥、⑦、⑧、⑨组成的信息提供部分。信息提供部分为特征核查操作提供运行所需要的节律单元韵律特征标注信息，以及节律成分间的可能性等级标注信息。韵律特征标注信息直接从词类-音节数序列中获得；可能性等级标注信息，一部分直接来自于对词类-音节数序列的深入挖掘，另一部分则来自于根据词类-音节数序列所识别出的部分语法结构信息。特征核查操作则根据所提供的信息，完成对语句韵律结构的预测。　　接下来，本文在特征核查操作模型的框架下，讨论了哪些信息是语句韵律结构预测所必不可少的，剔除冗余信息，并为保证语句韵律结构预测能够从简单的词类-音节数序列中得到足够的信息支持，提出了如下八点结论：　　 (一)挖掘并利用最不可能构成韵律单元的词类组合信息，将语句分割为若干个局部，使预测语句韵律结构真正摆脱对全句语法结构的依赖；　　 (二)预测韵律结构并不需要全部语法信息：分析音步及停延段结构生成过程，分别确定音步结构预测、停延段结构预测所涉及的范围及必要的语法信息；　　 (三)并不是所有的语法结构都影响停延段结构预测：分析停延段结构生成过程，确定可能影响其预测的语法结构，并针对这些语法结构分别采取措施解决；　　 (四)挖掘了单音节成分在音步组织中的表现，并利用这一信息预测语句音步结构；　　 (五)全面分析了含动复合词的类型，提出识别语句中含动复合词的方案，并利用其预测语句韵律结构；　　 (六)根据词在韵律结构组织中的作用，将韵律表现增加为词类区分的分布特征，将原本服务于汉语语法分析的词类系统调整为更适用于韵律结构预测的词类系统；　　 (七)深入挖掘并利用虚词在语法结构识别、韵律结构生成中的表现，借以预测语句的音步结构；　　 (八)挖掘并利用了大量不需要依赖语法结构的、直接来源于词类-音节数序列的、对语句韵律结构预测有帮助的信息。　　基于以上的操作，本文成功构建了基于词类-音节数序列的语句韵律结构预测系统。下面分别说明论文各章的主要内容。　　第一章，在深入分析前人提出的各种韵律组织过程分析模型的基础上，提出了线性语法关系基础上的韵律特征核查模型。并基于这一模型阐明了基于词类-音节数序列的语句韵律结构预测系统框架。　　第二章，详细分析了词类、音节数信息能够为语句韵律结构预测提供的多种支持，同时，根据对韵律结构生成过程的分析，指出预测语句韵律结构只需要有限范围内的语法结构信息。　　第三章，首先分析了单音节成分在音步结构组织中的表现，并结合第一章提出韵律特征核查操作的音步结构核查操作部分，进一步说明如何利用这些单音节成分的韵律表现特性预测语句音步结构。　　第四章，首先以大量含动复合词语料为基础，分析了含动复合词的层次结构，并进一步提出了不同于前人的含动复合词构成分析--这一分析更简单、语料覆盖面更广。接下来，基于对含动复合词构成的分析，说明了如何自动识别含动复合词以及如何利用这一信息预测语句韵律结构。　　第五章，系统说明基于词类-音节数序列的语句音步结构预测系统。具体包括预测系统的理论基础及详细操作过程。整个系统，操作过程清晰，操作条件明确，便于代码化。　　第六章，系统说明了基于词类-音节数序列的语句停延段结构预测系统。指出词类-音节数序列可以为停延段结构预测提供大量支持、指出停延段结构预测不需要识别全句语法结构、指出可能影响韵律结构预测的语法结构。最后说明如何利用助词“的”、介词帮助预测韵律结构。　　第七章，进一步总结全文的操作。

其他文献

《飘》

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

《飘》

苏轼理趣诗研究

本文尝试从宋诗与宋学(宋代思想文化)的关联视角切入,综合运用文学研究与文化研究、微观与宏观研究结合的方法,系统解读苏轼诗的理趣,希望通过苏轼理趣诗的研究,对苏轼研究和

学位

《Traditional Market》

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

流浪宝宝

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

明代庄子学研究

上个世纪八十年代以来,庄学史的研究成为庄学研究中的一个热点,各种研究成果相继问世。然而,受传统学术思想的影响,《庄子》着述数量居历代之冠、而且是名家辈出、有着独特发

学位

明代时期庄子学伪书考辨阳明心学学术思想

基于移动互联网的大学生思想政治教育实效性创新研究

处于移动互联网的快速发展之下,大学生思想政治教育该如何突破、如何开展以及工作中新方式方法的制定都需要依赖移动互联网作为新的信息平台,而这个平台对于高校中思想政治教

期刊

思想政治教育互联网移动互联网思想教育教育者自身效用教育工作者高校思想教育思想政治教育课被教育者

高速·滨湖时代广场C1号楼风洞测压试验

对高速·滨湖时代广场C1号楼进行了刚体模型测压风洞试验,详细介绍了风洞试验的方法,通过风洞试验测试结构的表面风压并且进行数据处理与计算分析得到结构体型系数,以供围护

期刊

风洞试验刚体模型层体型系数风荷载高层建筑

“皇马”与大理石结缘

期刊

长度计量基础知识讲座(十四)

第十四讲圆锥量规rn圆锥量规是机械加工过程中测量以及长度计量中常用的量具.它是以内、外圆锥相配合的实体,用于检验相应圆锥配合工件的锥角和圆锥直径的量具.rn

期刊

长度计量计量基础圆锥量规机械加工过程圆锥配合量具锥角直径实体检验工件测量

高海拔特长公路隧道低碳通风方案研究

本文针对西部高原寒区电力匮乏地区的公路隧道通风问题,以西藏墨脱公路嘎隆拉特长隧道为研究背景,利用空气动力学原理,推导了隧道自然通风的计算方法。结合隧址区气候条件,分

期刊

基于词类-音节数序列的汉语语句韵律结构预测研究

其他学术论文