语调识别在语音识别中的应用

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:ribenandchina
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前的语音识别技术在研究和应用领域都取得了很大的进展,口语对话系统就是其中的一个热门应用。语音识别作为对话系统的前端模块,其性能直接影响整个系统的性能。但在传统的语音识别系统中,识别的输出结果只有一串简单的文字,而包含在语音中的一些声学信息就被抛弃了。目前,国际上的主流机构已经对这个领域展开了广泛的研究,其中多集中在英语的对话行为(Dialog Act)方面的研究。针对汉语是有调语言的特点,本文的目的就是为传统的语音识别引擎的输出结果增加语调信息,从而能反应出说话者的情感因素。考虑到汉语的常用语调为陈述、疑问和感叹等,在本文中,我们暂时只对这三种语调进行研究。由于汉语语调的研究还是一个开放性的问题,本文采取了先进行单个特征的研究,然后选择区分性强的特征的方法,最终提出了一种鲁棒的语调识别的方法。在特征选择和融合的任务中选择支持向量机作为分类器。在我们的实验中,先用语音识别的基本方法对待测语音进行识别,然后使用识别结果代替标注的文本。这样处理的目的在于在真实的语音识别环境中模拟语调分类。本实验中的实验数据是精心设计的,包括三种语调的句子,一共是大约4700句。实验结果表明,在三种语调的分类任务中,我们的系统达到了84.13%的识别率。
其他文献
基于内容的多媒体信息检索是当今多媒体分析和处理领域的一个重要研究方向。它通过计算用户提交的查询实例与数据库中实例的内容相似度,对数据库中的实例进行自动排序,从而使用
控制系统性能的优劣直接影响工业生产经济效益的高低,甚至关系着整个工业生产的安全问题。在影响控制系统性能的众多因素中,控制器参数是不可忽略的主要原因。在实际工业过程
随着现代控制系统的结构越来越复杂,对其各部件的可靠性、准确性的要求也越来越高,从而出现了故障诊断与容错控制技术,并且在航空、航天、机器人、工业过程等领域已经取得了
口语发音的自动检错和诊断是计算机辅助语言学习和测试领域的关键技术之一。本文在深入分析现有技术的发展现状和总结前人已有成果的基础上,面向大规模人群口语测试的应用背景
抑郁症是一种以心境障碍为主的精神障碍疾病,发病率约为6.1%且呈逐年上升趋势,给家庭和社会造成极大负担,但其诊断正确率偏低,误诊率偏高。基于脑功能连接的多元模式分析是抑郁症
学位
随着经济的发展,人们生活水平的不断提高,各种服务机器人应运而生。目标跟踪技术是实现服务机器人与使用者友好交互的关键环节。各种跟踪算法和理论在视频图像序列的目标跟踪
手写汉字识别是一个典型的模式分类问题,它具有类别多、维数高的特点。目前常用线性判别分析(LDA)方法降维到低维子空间来解决。然而由于汉字识别的类别数(几千类)远大于特征
粮食是国民经济的基础,在努力提高粮食产量的同时,有必要保持合理的粮食储备。采用合理的粮食储藏技术有助于保持粮食品质、减少虫霉危害和有毒有害物质的污染。可以说粮食储
电镀天车调度问题是一类具有时间约束、次序约束和资源约束的组合优化问题。在理论上已经证明,电镀天车调度问题是一个N-P难题,而解决这一问题的关键在于研究和应用性能良好的优化调度方法。目前多数对自动化电镀生产线天车调度问题的研究均集中在单一天车、单一产品的环境下,以提前规划的方法,求得最佳天车行程路线。但实际电镀生产线通常用多辆天车同时运行以提高搬运效率,一条生产线也不仅仅只加工一种产品,而采取这种提