汉语文本自动注音方法研究与系统实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:ynhappyma
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文主要针对汉语字-音转换,即汉语文本的自动注音方法开展了研究.汉语字-音转换是自然语言处理的基本问题之一,也是语音合成的第一步,对语音识别的研究也具有重要意义.同时,在实际生活中可以用于普通话教学,含拼音出版物的自动注音,电视字幕自动对齐等.汉语字-音转换的难点在于多音字的处理.该文通过对多音字的分析,采用了较为成熟的分词、未登录词识别和词性标注技术,然后进行注音的方法,取得了较好的结果.通过实验结果的比较分析,证明了词性信息在汉语字-音转换的重要作用.实验表明,采用词性信息比仅采用分词信息的系统性能提高了37.7﹪.在实现方法上,该文比较了基于双向扫描,规则和统计相结合的分词方法与基于二元文法的N最短路径分词方法的优缺点.字-音转换系统采用N最短路径的分词方法,并结合了多种统计模型,包括N元文法的语言模型,词性标注的HMM模型,未登录词的HMM模型等.但是,在语料库不充分的情况下,我们只能求助于规则的方法,比如文本规范化模块,基于词性标注结果的注音实现模块等.最终我们实现了一个汉语字-音转换系统,并成功应用于语音合成系统和语音文本对齐系统中.
其他文献
本文研究了不同浓度(0、0.2、0.5、0.8mmol/L)的亚精胺(Spd)和不同浓度(0、0.5、1.0、1.5mmol/L)硫代硫酸银(STS)对牡丹“大胡红”、“朱砂垒”和芍药“大富贵”品种花期花瓣
在当今的信息时代,互联网的使用已是无处不在,但随之而来的网络安全问题却也日异突出。为了解决这一问题,可以通过使用虚拟专用网(VPN)技术来构建安全网关系统,这样在互联网上交
摘要:初中数学学习过程中,教师必须要注意学生数学思维的培养,而且还应选择合适的方式有效提升学生数学综合能力,在初中数学阶段的教学,必须要注意习题教学的重要性。利用习题教学可以使学生的知识体系得以有效增强,并且还能够确保学生形成良好的学习习惯,解决其在学习过程中遇到的问题。基于此本文就针对初中数学习题教学进行充分分析与研究,得出与之相关的调整方式,并发现其重要作用,希望可以给相关人士提供帮助。  关
在油井自动化监控系统应用方案中,一个最基本的方法就是获取监控数据,画出示功图,再利用神经网络的方法,通过与各种故障的参考图形特征来比较识别,从而进行故障判断.但该过程
结缕草是一种应用非常广泛的草坪植物,也是一种克隆植物。通过对其生长过程进行详细观测,发现结缕草的生长呈现出很强的规律性。主匍匐茎和二级匍匐茎的生长特性具有一定相似性
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
在扩频通信系统中,伪随机(PN)序列的精确快速同步是一项关键性技术,也是近年来各国学者和研究人员的热门研究课题.该文研究了一种新的直接序列扩频通信系统的扩频序列捕获方
当今互联网技术飞速发展,越来越多的人在网上发表网络评论。其中,由就医者自由发表的就医评论,受到广大求医问诊者的关注,也成为就医者选择医院、医师的重要参考。针对大量就医评
本文通过对荣华二采区10
期刊
近年来,随着OFDM技术应用领域的拓展,国内外已开始研究适用在TDD、FDD系统的自适应OFDM技术。该技术充分利用发端知道信道信息的条件,调整发送参数,进一步提高系统抗频率选择性衰