嵌入式汉英双语混合语音识别技术的研究

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户：Lynn_lin

【摘要】

：

本文系统地研究了汉语语音识别系统在嵌入式设备语音交互应用中的三个关键问题，即如何降低语音识别系统的计算和存储资源消耗、提高语音识别系统的鲁棒性、以及处理中国人说英

【作者】

：

浦剑涛

【机构】

：

中国科学院自动化研究所

【出处】

：

中国科学院自动化研究所

【发表日期】

：

2008年期

【关键词】

：

语音识别模型参数共享嵌入式设备语音交互

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文系统地研究了汉语语音识别系统在嵌入式设备语音交互应用中的三个关键问题，即如何降低语音识别系统的计算和存储资源消耗、提高语音识别系统的鲁棒性、以及处理中国人说英语和汉英双语混合语音识别所面临的建模和搜索问题。　　在降低语音识别系统的计算和存储资源消耗方面：　　 1.研究了声学模型参数共享技术，提出了基于连续概率分布函数的TM-SDCHMM模型和基于离散概率分布函数的SDC—DHMM模型，在不降低模型精度或略微降低模型精度的情况下，减少了模型复杂度。　　 2.通过简化声学得分计算，和基于在线路径可信度的高精度路径裁减，降低了搜索空间大小，提高了搜索解码的效率。　　 3.针对定点处理器，提出了语音识别系统的定点化的数据表示、模型参数预运算和声学得分计算方案，提高了语音识别系统在定点处理器上的运行速度。　　在提高语音识别系统的鲁棒性方面：　　 4.在信号空间，提出了面向信号处理的语音综合预处理方法，适用于复杂的嵌入式语音应用环境，包括：异常信号检测和过滤、基于TMWF的语音增强和基于子空间能量和边缘检测滤波器的语音端点检测。　　 5.在特征空间和模型空间，研究了特征规整、特征平滑和Multi-condition的声学模型训练方法。　　 6.在系统应用层次，研究了多候选机制、基于后验概率和基于音素混淆度的可信度度量技术、基于自适应增益控制的背景噪声抑制和基于引导词语法的0OV拒识，提高了语音识别系统在实际应用环境下的鲁棒性。　　在处理中国人说英语和汉英双语混合语音识别方面：　　 7.在分析中国人的英语口音语音库的基础上，提出了扩展的英语声学建模单元，使得中国式英语也能够达到较高的识别率。　　 8.在分析双语混合识别模型精度不匹配的问题的基础上，提出了通过手工调整模型精度均衡和混合建模自动均衡模型精度两种方法来解决这个问题。并针对汉英双语独立建模和混合建模的三音子声学模型，分别给出了相应的搜索框架。　　本文的研究成果已经成功应用于语音拨号软件和不同的嵌入式设备、嵌入式操作系统、嵌入式微处理器中。

其他文献

混合系统安全性验证及安全性控制的研究

混合系统是连续动态与离散动态并存且相互交互的异构动态系统。混合系统的应用非常广泛，如嵌入式系统、网络控制系统、工业制造、化学过程、航空交通控制等领域。混合系统的研

学位

混合系统安全性验混合系统安全性验安全性控制安全性控制动态复杂性动态复杂性抽象精化控制抽象精化控制

在轨航天器风险规避轨道转移策略研究

本文主要对在轨航天器轨道转移策略研究，本文先介绍了航天器风险评估，预警，主要坐标及其之间的相互转换；还介绍了变轨比较成熟的方法：Holmmann转移，Lambert转移等轨道优化转移方法

学位

航天器轨道转移遗传算法紧急规避临界变轨点

移动机器人环境建模与定位问题研究

移动机器人环境建模与定位问题是移动机器人研究领域中的基本问题，它是实现自主导航的基础。尽管对此问题的研究已有二十多年的历史，但仍然存在尚未解决的问题以及不断出现的新

学位

移动机器人环境建模超声传感器自主导航物理特性

数字几何处理中若干问题的研究

数字几何处理就是处理点云数据或网格数据的技术，它是计算机图形学的一个重要分支，在仿真、动画等领域有着重要的应用。它主要研究领域包括曲面重建，网格简化，网格光顺，网格修复，参

学位

交叉参数化内蕴尺度空间数字几何处理点云数据网格简化

基于图像分析的异常检测算法研究及应用

异常检测是图像处理和模式识别领域的重要应用之一。利用图像处理和机器学习算法对图像进行分析，检测出图像中的异常部分，不仅能够减轻人工处理的工作量、克服不同操作人员之间

学位

图像处理异常点检测骨扫描图像安检系统支持向量机

基于移动代理的智能汽车控制研究

智能汽车是智能交通的重要组成部分，研究智能汽车对于缓解交通压力、提高驾驶的安全性和舒适性具有重要意义。智能汽车是计算机、现代传感、信息融合、通讯、人工智能及自动控

学位

汽车自动驾驶系统多代理系统Petri网智能控制智能汽车

基于FPGA的二维离散提升小波变换IP核设计

小波变换是时间.尺度分析和多分辨率分析的一种新技术，其中提升小波变换具有许多优良的特性，它在信号分析、图像处理等多领域都取得了广泛的应用成果。而IP核的设计与复用技术

学位

二维离散提升小波变换IP核设计CSD编码常系数乘法器现场可编程门阵列

径向哈特曼像质检测系统动态采样控制方法研究

大口径光学系统的像质检测技术是大型望远镜研制中的一项关键技术。随着大口径光学系统口径日益增大，传统的光学系统像质检测方法所需求的大口径标准平面镜存在制作难度高、制

学位

大型望远镜大口径光学系统像质检测系统双五棱镜测量控制子孔径排布数据采集数据处理

面向机器人的自然人机对话技术研究

面向机器人的自然人机对话技术研究是指根据智能机器人语音交互的要求，研究人机口语对话系统关键技术，使用户和机器人能比较自然地对话。自然对话是指在用户说话方式、说话内容

学位

人机对话技术机器人对话系统关键词识别语料平衡法语音交互语音识别

基于NiosⅡ的仿人机器人控制系统的研究

仿人机器人是多门基础学科与多项高技术的集成，代表了机器人的是当前机器人研究领域最活跃的研究方向之一，日益受到世界各国普遍关注视。国内外普遍采用以单片机或DSP作为控制

学位

仿人机器人控制系统微处理器无线控制

嵌入式汉英双语混合语音识别技术的研究

其他学术论文