【摘 要】
:
发音自动评估是计算机辅助语言学习(CALL)的一个重要课题,其目的就是用计算机对语言学习者的发音水平进行自动评估,辅助其纠正发音错误,提高口语水平。由于受语速、语调等因
论文部分内容阅读
发音自动评估是计算机辅助语言学习(CALL)的一个重要课题,其目的就是用计算机对语言学习者的发音水平进行自动评估,辅助其纠正发音错误,提高口语水平。由于受语速、语调等因素的影响,直接采用与标准语音比对的方式无法真实反映出发音的准确性,加上母语发音的影响以及说话人自身发音的特点,对发音进行自动评估十分困难。常用的方法是采用自动语音识别技术建立语言模型,对待测语音进行识别,根据识别系数来对发音的水平进行评估。随着自动语音识别技术的不断发展,发音自动评估方法也越来越成熟。本文系统研究了隐马尔可夫模型基础理论,论述了基于隐马尔可夫模型的英语发音模型,针对母语为汉语的说话人对其进行了改进。在发音模型的构建过程中,详细阐述了语音特征参数选择与提取的过程以及模型参数训练方法。针对该模型,设计了一种对发音水平进行分等级评估的算法。同时,还给出了该发音自动评估系统在PC机上的实现过程。在基于隐马尔可夫模型的发音评估系统中,母语发音特点对第二语言发音的影响使得评估模型状态与测试语音的相似度下降,导致发音自动评估系统的准确度降低。针对这种情况,本文利用母语为汉语的说话人的易混淆音对发音模型进行了改进,使其更加符合这类人发音的特点。为了对发音进行评估,本文设计了一种针对该模型的评估算法,以维特比强制对齐系数与自动语音识别系数的距离为评分基础,将得到的系数映射到评分区间,以此来表征测试者的发音水平。本文以HTK工具包为基础,实现了母语为汉语说话人的英语发音自动评估系统。该系统主要包括发音评估引擎、语音采集与处理模块、波形显示模块等三部分。发音评估引擎是该系统的核心,通过对HTK进行二次开发实现。系统各模块间通过标记文件进行数据传递。测试结果表明,该系统与人工评分的相关系数为0.89。
其他文献
心脏是人体最重要的器官之一,它是一个复杂的、时变的非线性系统。心脏疾病一直是威胁人类健康甚至是致命的主要疾病之一,心律失常是最常见的心脏疾病。心电信号则是评价心脏功
PoC(Push to Talk over Cellular,基于蜂窝网络的一键通话)业务由集群通信技术中的PTT(Push To Talk)业务演化而来。作为指挥调度的重要的通信模式,集群通信的PTT业务在经济建设
电机控制技术随着电力电子技术和微处理器控制技术的发展突飞猛进,大致经历了调压调频控制、矢量控制和直接转矩控制三个阶段。直接转矩控制以新颖的思想、简单的结构、直接的控制手段和优良的动静态特性而得到了广泛的使用。无速度传感器的直接转矩控制更因其不用安装速度传感器,受外界环境影响相对较小,以及能够提高系统的可靠性等诸多优点而成为变频调速领域的研究热点。本文首先介绍了直接转矩控制技术的研究背景和国内外研究
双基地MIMO(Multiple Input Multiple Output-多输入多输出)雷达综合了双基地雷达和集中式MIMO雷达的优点,规避了二者的一些不足,成为MIMO雷达方向近期的研究热点。本文研究
新一代无线通信信号展现出宽带包络大动态范围的特点,迫使射频功率放大器工作在低效的回退功率点上,造成能源浪费和系统成本增加。 针对这一问题,需要探索能够准确衡量功率放
舰船的逆合成孔径雷达(Inverse Synthetic Aperture Radar,ISAR)成像主要通过雷达与舰船之间的相对运动而生成二维图像。ISAR可以在各种天气下,全天候地工作,ISAR成像识别技
随着不同无线通信系统的应用,无线电频谱成为了越来越珍贵的资源。为了缓解无线频谱短缺和不同无线系统互相干扰的状况,本论文研究了近年来广泛开展的课题:感知无线电技术;并基
随着信息化时代的到来,实时的视频采集与显示系统在多媒体、图像通信等许多领域的应用日益广泛。DSP和CPLD/FPGA是实时视频图像处理的理想硬件,所以基于DSP和CPLD/FPGA的视频图
作为一种在无线环境下实现高频带利用率的有效手段,因其具有较强的抗多径衰落和抗码间干扰(Inter-Symbol Interference, ISI)能力、高效的频谱利用率等优势,正交频分复用(Ort