语种识别技术研究及系统实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:xxyy001a
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着2008年北京奥运会的临近,国内对于多语种服务的需求越来越大。不论提供多语种的人工翻译服务,还是提供自动的多语种服务,都需要首先确定用户使用的语种,因此语种识别技术有着巨大的应用需求。语种识别系统是指通过用户输入的一段语音自动判决用户输入语音的语种类别的系统。语种识别研究在多语种人工服务和翻译系统、国际救援呼救系统、多语种电视和广播监播、语音识别系统方言处理、多语种语音识别系统前端处理等方面起到重要作用。 本论文研究了语种识别的相关技术,首先利用移动差分倒谱特征(ShiftDeltaCepstra,SDC)和高斯混合模型(GMM)建模的方法,并且针对语种识别系统训练和测试语音出现的噪声和信道失配问题,引入了说话人识别和语音识别研究中常用的端点检测、模型自适应、性别相关模型、特征弯曲,特征映射等方法,提高了系统性能,在NIST2005数据上达到了15﹪的等错误率。 本论文还利用音子序列特征N元文法进行建模的并行音子识别并建立语言模型(ParallelPhoneRecognitionfollowedbyLanguageModel,PPRLM)的方法,并且针对于数据稀疏问题尝试了多种插值平滑和回退平滑方法,引入了反模型的方法,尝试了以音子网络取代音子串作为特征等方法,最终在NIST2005数据上达到了11﹪的等错误率。 本论文还尝试了采用高斯符号化特征和N元文法建模的方法,由于建模方法粗糙,系统性能不如上述两种系统,在NIST2005数据上达到30﹪的等错误率。 最后本论文通过采用多层感知器的神经网络在得分层次上对上述三种系统进行融合,在NIST2005数据上达到了8﹪的等错误率。
其他文献
随着MEMS技术、无线通信技术和微芯片技术的发展,一种由大量的具有一定计算能力和通信能力的传感器节点所组成的传感器网络出现了,作为一种新的网络计算平台,它改变了人们与物理
一个嵌入式Linux开发平台由交叉工具链,BootLoader,Linux内核,文件系统以及图形用户界面(GUI)等几部分组成,它是嵌入式Linux系统中各应用任务开发和运行的基础。针对一个新的特定
利用植物生物反应器生产有重要价值的外源蛋白的技术成为目前生命科学领域研究的热点内容之一。目前,该技术的一个重要且急需解决的课题是使外源蛋白基因高效且特异性地在植物
以等质量比的不同发育阶段的麻疯树(Jatropha curcas L.)胚乳为材料,提取纯化mRNA,使用Stratagene公司生产的cDNASynthesis Kit、Gigapack IIIGold Packaging Extract,用Uni-ZAP
[目的]检验知觉模板模型(PTM)在复杂图形(线划面孔)的知觉学习中的有效性,同时考察知觉学习过程对EEG维度复杂性以及面孔识别ERP的影响,从脑电数据分析的角度找出知觉学习的相
Turbo码是一种具有极强纠错性能的前向纠错码,已被广泛运用在通信系统中。本文重点研究基于分组检测的最大后验概率译码算法,它是Turbo码最大后验概率译码的改进算法。该译码算
水下目标分类识别具有很高的军用和民用价值,一直是国内外水声界研究的热点。对水下目标的正确分类识别是建立在有效的特征提取技术上的,特征提取是目标识别过程中的关键,它直接
近年来,社交网络服务迅猛发展,用户人数呈爆炸式增长。通过社交网络服务,人们除了进行日常的社交行为,则更多的是将其当作公共媒体平台。调查发现,除了跟好友保持联系之外,人
在未来的无线通信领域中,如何提供高速度、高质量和多样化的数据业务是研究的热点之一。正交频分复用(OFDM)技术以其高数据传输速率、高频谱利用率和有效对抗频率选择性衰落
随着各国GNSS的建设与发展,GNSS应用领域也在随之不断扩大,用户对卫星导航定位产品的精度、可靠性要求也越来越高。我国BDS在亚太地区正式开通服务,也使得三频GNSS导航定位技