论文部分内容阅读
语句韵律结构自动预测是汉语文语转换中非常重要的一项内容,直接影响合成语音的自然度。本文第一次成功构建了完整而清晰的基于词类-音节数序列的语句韵律结构预测系统。这一基于词类-音节数序列的语句韵律结构预测系统,全部输入信息只有语句的词类-音节数序列,输出为包含音步结构、停延段结构的语句韵律结构。根据这一系统,音步结构预测正确率达95%,停延段结构预测正确率至少达81%,效果已达到甚至超越基于大规模语料库训练所构建的统计预测模型。
在构建系统的过程中,我们提出了全新的语句韵律结构生成分析模型--线性语法关系基础上的韵律特征核查操作模型,简称韵律特征核查模型,这一模型是整个预测系统的基础。韵律特征核查模型的全部输入信息为计算机非常容易获得的词类-音节数序列,输出为语句的韵律结构。相较前人的模型,这一模型真正系统、清晰地说明了语句韵律结构的生成过程。另外,这一模型不只适用于本文,同样也适用于基于统计的预测系统。
模型具体内容如下图所示:
整体来看,韵律特征核查模型分为两个组成部分:由②、③、⑩构成的特征核查操作;以及由④、⑤、⑥、⑦、⑧、⑨组成的信息提供部分。信息提供部分为特征核查操作提供运行所需要的节律单元韵律特征标注信息,以及节律成分间的可能性等级标注信息。韵律特征标注信息直接从词类-音节数序列中获得;可能性等级标注信息,一部分直接来自于对词类-音节数序列的深入挖掘,另一部分则来自于根据词类-音节数序列所识别出的部分语法结构信息。特征核查操作则根据所提供的信息,完成对语句韵律结构的预测。
接下来,本文在特征核查操作模型的框架下,讨论了哪些信息是语句韵律结构预测所必不可少的,剔除冗余信息,并为保证语句韵律结构预测能够从简单的词类-音节数序列中得到足够的信息支持,提出了如下八点结论:
(一)挖掘并利用最不可能构成韵律单元的词类组合信息,将语句分割为若干个局部,使预测语句韵律结构真正摆脱对全句语法结构的依赖;
(二)预测韵律结构并不需要全部语法信息:分析音步及停延段结构生成过程,分别确定音步结构预测、停延段结构预测所涉及的范围及必要的语法信息;
(三)并不是所有的语法结构都影响停延段结构预测:分析停延段结构生成过程,确定可能影响其预测的语法结构,并针对这些语法结构分别采取措施解决;
(四)挖掘了单音节成分在音步组织中的表现,并利用这一信息预测语句音步结构;
(五)全面分析了含动复合词的类型,提出识别语句中含动复合词的方案,并利用其预测语句韵律结构;
(六)根据词在韵律结构组织中的作用,将韵律表现增加为词类区分的分布特征,将原本服务于汉语语法分析的词类系统调整为更适用于韵律结构预测的词类系统;
(七)深入挖掘并利用虚词在语法结构识别、韵律结构生成中的表现,借以预测语句的音步结构;
(八)挖掘并利用了大量不需要依赖语法结构的、直接来源于词类-音节数序列的、对语句韵律结构预测有帮助的信息。
基于以上的操作,本文成功构建了基于词类-音节数序列的语句韵律结构预测系统。下面分别说明论文各章的主要内容。
第一章,在深入分析前人提出的各种韵律组织过程分析模型的基础上,提出了线性语法关系基础上的韵律特征核查模型。并基于这一模型阐明了基于词类-音节数序列的语句韵律结构预测系统框架。
第二章,详细分析了词类、音节数信息能够为语句韵律结构预测提供的多种支持,同时,根据对韵律结构生成过程的分析,指出预测语句韵律结构只需要有限范围内的语法结构信息。
第三章,首先分析了单音节成分在音步结构组织中的表现,并结合第一章提出韵律特征核查操作的音步结构核查操作部分,进一步说明如何利用这些单音节成分的韵律表现特性预测语句音步结构。
第四章,首先以大量含动复合词语料为基础,分析了含动复合词的层次结构,并进一步提出了不同于前人的含动复合词构成分析--这一分析更简单、语料覆盖面更广。接下来,基于对含动复合词构成的分析,说明了如何自动识别含动复合词以及如何利用这一信息预测语句韵律结构。
第五章,系统说明基于词类-音节数序列的语句音步结构预测系统。具体包括预测系统的理论基础及详细操作过程。整个系统,操作过程清晰,操作条件明确,便于代码化。
第六章,系统说明了基于词类-音节数序列的语句停延段结构预测系统。指出词类-音节数序列可以为停延段结构预测提供大量支持、指出停延段结构预测不需要识别全句语法结构、指出可能影响韵律结构预测的语法结构。最后说明如何利用助词“的”、介词帮助预测韵律结构。
第七章,进一步总结全文的操作。