基于FPGA的嵌入式说话人识别系统实现

来源 :重庆大学 | 被引量 : 0次 | 上传用户:dianzi511
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是近年来高速发展的一项技术,让机器通过语音来识别说话人的身份是这项研究的主要目的。随着计算机与电子技术的发展和说话人识别理论的不断完善,说话人识别技术应用于实际生活与工作的要求也越来越迫切。经过从上世纪三十年代至今的研究,已经有许多较成熟的说话人识别理论模型。SOPC是一种基于FPGA的片上可编程逻辑系统,基于SOPC的系统开发首先应合理规划系统架构,选择适于嵌入式平台实现的算法与外设,充分利用有限的系统资源实现系统功能。本课题主要任务是在综合考虑系统资源与识别效果的情况下,选择合适的说话人识别算法与语音参数,在SOPC平台上实现具有一定速度与精度的嵌入式说话人识别系统。本课题以说话人识别技术、信号处理技术和基于SOPC的嵌入式系统技术为理论基础,提出了一套有效可行的系统架构方案,在对说话人识别技术中各个环节的算法进行较为深入的研究,结合NiosII嵌入式处理器和FPGA自身特点,对整个算法进行了合理的选择与优化,并根据算法特点与耗时情况有选择地用软件或者软件、硬件模块结合实现。论文的内容主要包括以下几个方面:1.对语音端点检测与特征提取算法作了深入研究,结合SOPC系统的设计特性,设计声音采集与语音端点检测流程,并针对特征提取流程设计了一种基于双处理器的SOPC流程结构。实验表明,在保证系统的误识率较低、可靠性高的基础上,有效提高了系统速度。2.研究了说话人识别的各种算法,重点分析了基于GA-K-VQ(遗传K聚类矢量量化算法)原理的识别算法,并最终在SOPC系统上实现。通过对算法的改进,设计合适的硬件模块加速,有效提高了说话人码书建立效率,试验表明,在不影响系统识别率的前提下,耗时最长的码书建立过程,硬件实现可比软件实现快2至4个数量级。3.在硬件上实现了设计方案,并设计必要的人机交互接口,最终实现了具有较短识别时间与较好识别率的说话人识别系统。实验结果表明,本文所提出的系统整体方案有效可行,基于SOPC的说话人识别系统在速度、精度、可扩展性等方面具有独特的优势,具有良好的发展空间。
其他文献
期刊
数字水印技术就是将数字化的水印信息嵌入到数字化媒体中,然后通过对水印的检测(提取)来对数字化媒体的使用情况进行跟踪,从而实现信息的隐藏传输、存储、版权保护等功能。目
逆合成孔径雷达(ISAR)是一种高分辨率成像雷达,能够对飞机、导弹、舰船和天体等目标进行成像,在军事和民用方面都有很重要的意义。ISAR采用大带宽的雷达发射信号获得目标的高
GPS车载定位与监控系统结合了GPS定位技术、计算机科学技术、数字无线通信技术和电子技术,在汽车上实现GPS数据的接收和记录,并结合GSM/GPRS无线传输网络技术,利用其数据传输功
近年来,全球变暖、能源危机以及环境污染的问题日益严峻,尤其是汽车排放所引起的空气污染是城市环境治理的一个主要难题。电动汽车作为一种使用清洁、可再生能源的交通工具,
移动Ad Hoc网络最大的特点是无中心、节点具有多跳转发的能力。因此路由是Ad Hoc网络研究的关键技术之一。目前大部分的路由研究着眼于找到一条连接源节点和目的节点的路由,
期刊
电磁超声检测技术是无损检测领域出现的新技术,具有无需耦合介质、对被测体表面无要求、检测费用低等优势,成为近些年来无损检测领域的热门研究方向。本文采用电磁超声技术,研究
期刊
期刊