嵌入式汉英双语混合语音识别技术的研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:Lynn_lin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文系统地研究了汉语语音识别系统在嵌入式设备语音交互应用中的三个关键问题,即如何降低语音识别系统的计算和存储资源消耗、提高语音识别系统的鲁棒性、以及处理中国人说英语和汉英双语混合语音识别所面临的建模和搜索问题。   在降低语音识别系统的计算和存储资源消耗方面:   1.研究了声学模型参数共享技术,提出了基于连续概率分布函数的TM-SDCHMM模型和基于离散概率分布函数的SDC—DHMM模型,在不降低模型精度或略微降低模型精度的情况下,减少了模型复杂度。   2.通过简化声学得分计算,和基于在线路径可信度的高精度路径裁减,降低了搜索空间大小,提高了搜索解码的效率。   3.针对定点处理器,提出了语音识别系统的定点化的数据表示、模型参数预运算和声学得分计算方案,提高了语音识别系统在定点处理器上的运行速度。   在提高语音识别系统的鲁棒性方面:   4.在信号空间,提出了面向信号处理的语音综合预处理方法,适用于复杂的嵌入式语音应用环境,包括:异常信号检测和过滤、基于TMWF的语音增强和基于子空间能量和边缘检测滤波器的语音端点检测。   5.在特征空间和模型空间,研究了特征规整、特征平滑和Multi-condition的声学模型训练方法。   6.在系统应用层次,研究了多候选机制、基于后验概率和基于音素混淆度的可信度度量技术、基于自适应增益控制的背景噪声抑制和基于引导词语法的0OV拒识,提高了语音识别系统在实际应用环境下的鲁棒性。   在处理中国人说英语和汉英双语混合语音识别方面:   7.在分析中国人的英语口音语音库的基础上,提出了扩展的英语声学建模单元,使得中国式英语也能够达到较高的识别率。   8.在分析双语混合识别模型精度不匹配的问题的基础上,提出了通过手工调整模型精度均衡和混合建模自动均衡模型精度两种方法来解决这个问题。并针对汉英双语独立建模和混合建模的三音子声学模型,分别给出了相应的搜索框架。   本文的研究成果已经成功应用于语音拨号软件和不同的嵌入式设备、嵌入式操作系统、嵌入式微处理器中。
其他文献
混合系统是连续动态与离散动态并存且相互交互的异构动态系统。混合系统的应用非常广泛,如嵌入式系统、网络控制系统、工业制造、化学过程、航空交通控制等领域。混合系统的研
本文主要对在轨航天器轨道转移策略研究,本文先介绍了航天器风险评估,预警,主要坐标及其之间的相互转换;还介绍了变轨比较成熟的方法:Holmmann转移,Lambert转移等轨道优化转移方法
移动机器人环境建模与定位问题是移动机器人研究领域中的基本问题,它是实现自主导航的基础。尽管对此问题的研究已有二十多年的历史,但仍然存在尚未解决的问题以及不断出现的新
数字几何处理就是处理点云数据或网格数据的技术,它是计算机图形学的一个重要分支,在仿真、动画等领域有着重要的应用。它主要研究领域包括曲面重建,网格简化,网格光顺,网格修复,参
异常检测是图像处理和模式识别领域的重要应用之一。利用图像处理和机器学习算法对图像进行分析,检测出图像中的异常部分,不仅能够减轻人工处理的工作量、克服不同操作人员之间
智能汽车是智能交通的重要组成部分,研究智能汽车对于缓解交通压力、提高驾驶的安全性和舒适性具有重要意义。智能汽车是计算机、现代传感、信息融合、通讯、人工智能及自动控
小波变换是时间.尺度分析和多分辨率分析的一种新技术,其中提升小波变换具有许多优良的特性,它在信号分析、图像处理等多领域都取得了广泛的应用成果。而IP核的设计与复用技术
大口径光学系统的像质检测技术是大型望远镜研制中的一项关键技术。随着大口径光学系统口径日益增大,传统的光学系统像质检测方法所需求的大口径标准平面镜存在制作难度高、制
面向机器人的自然人机对话技术研究是指根据智能机器人语音交互的要求,研究人机口语对话系统关键技术,使用户和机器人能比较自然地对话。自然对话是指在用户说话方式、说话内容
仿人机器人是多门基础学科与多项高技术的集成,代表了机器人的是当前机器人研究领域最活跃的研究方向之一,日益受到世界各国普遍关注视。国内外普遍采用以单片机或DSP作为控制