语音识别技术的研究与应用

来源 :北京信息科技大学 | 被引量 : 0次 | 上传用户:rtpy1015
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术的研究及应用正处于方兴未艾时期。由于汉语具有结构复杂、以单音节为主、同音字多、方言种类多等特点,造成了对汉语语音识别的障碍。针对孤立的汉语词,传统的DTW、HMM等识别方法已经基本上能将其识别出来,但仍然达不到人们期望的精度。本文提出一种基于CDHMM和BP的混合语音识别模型,可以有效地提高对于孤立汉语词的识别效率。  本文的研究工作主要分为两个部分:一是对小词汇量、非特定人的孤立汉语词识别的关键技术的研究;二是对汉语语音在实际中应用模型的研究。针对孤立汉语词识别,本文利用CDHMM和BP在语音处理中的优异特性,提出了一种基于CDHMM和BP的混合语音识别模型。该模型以Viterbi解码输出的状态转移概率矩阵作为反向传播(BP)神经网络的输入。这是由于离散隐马尔科夫(DHMM)容易造成很大的量化误差,故采用连续密度的隐马尔科夫模型(CDHMM)。而又考虑到BP神经网络的非线性映射能力,因此采用BP神经网络作为语音识别输出部分。实验证明,这种混合模型在孤立词的识别上相较于HMM模型,其识别率提高了3-4个百分点。  针对汉语语音的应用,本文设计出了基于音节相似度算法的语音查询系统和校园网页的浏览系统。该种系统以中词汇量、连接词为基础,采用Microsoft提供的语音开发平台为基础。该系统利用SDK得到一个初始识别,再根据音节相似度算法,让初始结果与词库相匹配,相似度越大,即默认为识别结果;最后利用默认的识别结果查询师生表和浏览网页。结果表明,采用音节相似度算法,可以使得对中词库量的语音识别率可以达到90%以上。
其他文献
近些年来随着移动互联网的快速发展,多媒体业务的出现和无线接入技术的进步,一方面,网络带宽消耗巨大;另一发面,人们越发迫切地希望随时随地的访问移动互联网。为了在下一代移
随着多媒体业务和无线宽带技术的发展,无线通信系统对服务质量、传输速率以及频谱利用率等方面的要求也不断提高。OFDM(正交频分复用)作为一种新型的物理层技术,正逐渐受到人
随着通信技术的发展,网络通信上层应用业务的多元化。用户对于网络所能提供的带宽要求也越来越高。面对EPON, GPON, 10GEPON等高速网络的发展需求,我们面临着如何解决在高速
信用类债券作为企业直接融资的一种创新方式,得到了企业的广泛认可。本文从信用类债券的定价理论入手,分析了我国信用类债券定价中存在的问题,提出了进一步完善信用类债券定
认知无线电技术能够主动检测无线环境中的频谱使用情况,通过重构能力,智能改变其通信参数,机会式选择频谱空穴进行通信,具有灵活、频谱利用率高等优点。   目前,为进一步提高认
混沌信号是一类内在确定外在类似随机性的特殊信号。与噪声相比,混沌信号是可控和可同步的。所以,混沌雷达既保留传统噪声雷达优点又克服了其无法控制的缺点,这使得混沌应用于雷
目的 观察秦苓液对尿酸性肾病大鼠过氧化物酶体增殖物激活受体 γ 辅助激活因子-1α(peroxi-some proliferator activated receptor coactivator-1 alpha,PGC-1α)、白介素-1
绘画创作对于我而言,是一个自然而然的习惯,早已不要刻意为之。我的创作沿着自定的自由散漫的路线行进,没有一定要遵守的规矩,唯有内心真情实感的牵引。就像《透明系列N075》
本文通过对荣华二采区10
期刊
造血干细胞移植已经成为逐渐增多的白血病、恶性肿瘤和某些遗传性疾病患者的临床治疗选择。造血干细胞来源于骨髓、脐带血及动员后的外周血。但由于来源及可获得的细胞数量有