麦克风阵列时间延迟估计和语音信号增强的研究

来源 :中国科学院声学研究所 | 被引量 : 0次 | 上传用户:whisperings
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音增强是一种信号的选择性处理技术,主要目标是解决从受到不同方式污染的语音信号中提取出尽可能纯净的目标语音信号的问题。由于语音增强技术的研究成果具有很强的实用性,与人们的生活密切相关,因此越来越受到人们的重视。 随着通讯技术的发展,人们发现在诸如视频会议或者车载通讯等复杂的应用环境中,不仅存在环境噪声,而且还有回声和混响的干扰,这时传统的单通道语音增强系统显得无能为力。为此,人们发展出了利用麦克风阵列进行语音增强的方法。该论文开展麦克风阵列的时间延迟估计和语音信号增强算法研究,达到进行麦克风阵列语音增强实时处理的目的。 该论文的主要工作如下: 1.通过对各种常见的时间延迟估计算法的延迟估计准确率受信噪比和混响时间的影响进行系统的对比研究,确定采用基于听觉特性的时间延迟估计算法作为语音增强系统的处理前端,使系统波束能够较好地跟随运动声源; 2.在前人工作的基础上提出了一种结合延迟—相加和改进维纳后滤波的波束形成器,实验表明,增强后语音的信噪比和大词汇量语音识别的识别率方面,比改进前的算法都有较大提高; 3.使用Aardvark公司的DirectProQ10作为数字音频输入输出接口,实现了一个完整的麦克风阵列语音增强实验系统,在语音增强处理的实时性和信噪比方面都达到了预期目标; 4.实现了一个分布式的语音识别实验平台,充分利用实验室多台计算机的闲置运算能力,极大的提高了语音识别实验的处理速度。
其他文献
该文主要分析研究了第三代移动通信的关键技术之一:功率控制技术.码分多址CDMA(Code Division Multiple Access)蜂窝移动通信系统是一个干扰受限系统,任何降低发射功率、降低
建构主义学习理论为网络应用于教学奠定理论基础,基于网络创建的“123”开发式教学模式“一个中心、两大基础、三种导学服务”广泛应用在高职英语教学中:以学生为中心,培养学
四月初的重庆,天气不冷不热,湿润的空气中飘着脆生生的重庆话,婀娜、泼辣的重庆妹子爽朗地笑着,说着,闹着,红艳艳的火锅汤子咕嘟嘟地滚着……山城留给我的印象很感性,当然不是这么寥
新课程理念下,理想的课堂就应该是“高效”的课堂.最好的教育就应该用最少的时间让学生获得最大发展和最多锻炼.随着教育的深入改革,课堂的高效性也受到越来越多的关注.课堂
电力销售市场是供电企业销售的主要对象,它体现了供电企业经营管理的经营成效。随着电力体制改革的不断深入,县级供电企业仍按自身的特点,在本营业区域内自主经营,所以市场营销中
中国矿业大学出版社是一家以出版矿业类科技著作、大中专院校教材和全国煤矿干部职工教育培训用书等为主要任务的专业科技出版社,近几年来,我社根据专业优势和特色,坚持面向
编辑是出版生产中最积极、最活跃的因素,是出版单位品牌缔造的基石,属于第一位的战略资源。当前,“智慧型出版”正在取代“经验型出版”,新时代的新型编辑需要培养学习能力,
在近几年的英语教学工作中,学生成绩两极化现象日益突出.作为一名英语教学工作者,这一现象使我感到忧虑.针对这些长时间积累下的客观存在的问题,笔者介绍一下自己在这一方面
在传统的数学教学中,教师与学生之间的互动多为单方面的讲授或指令,即教师考虑更多的是如何实现预定的教学目标,而忽略了学生的反应和思考,致使学生在枯燥、无趣的数学活动中
期刊
2015年10月15日~17日,来自全国各地的100余位批发商、供应商和零售商代表共聚历史悠久的眼镜之乡——江西鹰潭,问道释义,探讨了互联网+时代,批发商该何去何从,如何运用数据分