基于非特定人语音识别的全音控盲人手机设计

被引量 : 0次 | 上传用户:scyscy2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,语音识别技术的发展为人们提供了一种先进的人机交互方式――语音交互方式。这种方式因其便捷、自然的特点,受到广泛的关注,并且已经开始应用于一些特定的场合与设备中,受到人们的广泛欢迎。而对于盲人来说,由于其视觉缺陷的阻碍,很多时候并不能享受到科技发展带来的好处;而语音交互的方式则可以有效的解决这一问题,使科技进步能更好的服务于这一残疾人群体。经过几十年的努力,语音识别的研究工作已经有了长足的发展,基于不同理论的语音识别方法目前已有许多种。然而多数的研究工作都是在大型机或PC机上进行的,关注的主要是新理论的发现与验证、如何继续提升识别算法的准确度等问题;而基于嵌入式系统的语音识别技术,作为语音识别实用化的重要步骤,目前还没能实现大规模的应用。现有的嵌入式终端设备上的语音识别,也主要是简单的、针对特定人使用的孤立词识别。因此,如何将复杂的语音识别算法在嵌入式系统上实现实用化,使语音交互技术变得成熟起来,是一项有挑战性的工作。因此,本文以如何让语音交互方式为盲人服务作为出发点,对语音识别的原理与思想进行了深入研究,详细探讨了基于隐马尔可夫模型的非特定人孤立词语音训练与识别算法,深入分析了基于Baum-Welch算法的模型训练方法和基于Viterbi解码的识别算法。根据实际应用的需要,研究了实际模型训练中多观察值序列情况下的初始参数设置、训练方法以及需要解决的数据溢出等问题;并以此为依据,提出并设计了一种基于连续隐马尔可夫模型的全音控盲人手机系统。系统采用Baum-Welch模型训练算法,由PC机训练出25条音控指令和0~9等10个数字的语音模型,然后将这些模型传递给DSP平台,从而实现嵌入式的非特定人孤立词语音识别。25条音控指令分别对应不同的控制操作,在识别完成后,系统根据识别结果作出相应处理;当需要进行无线通信时,系统会依据识别结果发送特定的AT命令组合,从而实现相应操作。依据手机菜单操作特点,本文提出了语音指令分级识别方法,充分提高了指令识别准确率;并针对实际应用进行了拒识别设计。针对盲人生理特点,系统设计了语音提示与短信播报等辅助语音功能,将3817个汉字、字母、数字的语音数据存入NandFlash,当需要语音播报时将播报内容的语音数据由DAC输出。最后在不同环境和条件下对系统进行了测试,并提出了改进的方向。
其他文献
马齿苋(Portulaca oleracea L.)广布于全世界温带和热带地区,在许多国家作为药食两用植物使用。马齿苋中含有脂肪酸、萜类、生物碱、香豆素、黄酮、酚酸和挥发油等多种化学成
我国制造业PMI指数是宏观经济运行的先行指标,具有较强的预警作用。为准确把握我国宏观经济运行趋势和制造业经营微观绩效走势,本文根据PMI指数数据建立ARIMA模型,并对2014年
我国市县级城市行政中心集中建设的热潮是伴随着改革开放和快速城市化的加快的进程而出现的。新建的城市行政中心对我国城市结构的改善,城市空间环境质量的提高,城市政府的自
作为权威性的社会公共权力主体,政府以公共政策作为管理社会公共事务的主要手段和方式。在公共政策执行中,政府运用公共权力对有限的社会资源进行权威性分配,这其中必然涉及
高空气象探测是现代气象探测系统中的一个重要组成部分,如何实时监控高空气象探测设备的运行状态,并及时对探测设备采集的探测数据进行汇总分析,进而判断探测设备的运行是否
随着信息技术的高速发展,用户对图像、音频、视频等多媒体信息的需求量急剧上升,对网络带宽的需求和对网络的高速互联正在成为令人瞩目的问题。光传送网(Optical Transport N
外来物种入侵己成为当今世界普遍关注的问题。检疫是以防止人类传染病、动物传染病及寄生虫病、植物危险性病、虫、杂草等传入传出国境为目的的。它对可能携带危险性有害生物
<正>审批与监管都是政府治理的重要手段,而在不同的经济社会环境中灵活处理审批与监管则是政府治理的艺术,能娴熟地运用这种艺术,就是政府能力的提升。因为这关乎市场和社会
随着全球Internet业务的迅猛发展,用户对网络的传送能力提出了更高的要求。分组传送网络(Packet Transport Network,PTN)不但保持了传统SDH(Synchronous Digital Hierarch,同
提出了一套应用于城市集中供热系统的节能方案和控制策略。该方案一次网采用均匀性控制策略,有效避免了热力站间的不平衡现象,实现了全网平衡;再辅以热源优化调度策略和二次