【摘 要】
:
特征提取是从语音信号中获得有效地表征说话人个性特质的参数,它是说话人识别的关键,也是语音信号处理研究的重点,因而受到极大的关注。 目前,在说话人识别中,常用的特征参数有
论文部分内容阅读
特征提取是从语音信号中获得有效地表征说话人个性特质的参数,它是说话人识别的关键,也是语音信号处理研究的重点,因而受到极大的关注。
目前,在说话人识别中,常用的特征参数有基音周期、共振峰、倒谱系数、LPC 系数及其派生参数、Mel频率倒谱系数等,其中,基音周期、共振峰和倒谱系数的获取均是基于傅立叶变换。分数傅立叶变换是传统傅立叶变换的推广,作为新的时频分析工具,已经被广泛地应用于信息安全、模式识别、光学系统分析、量子理论等领域。在本文中,我们将分数傅立叶变换应用于说话人的特征提取,获得了一些初步结果。
首先,用前两个整数阶余弦变换的线性叠加构造了一种分数余弦变换,并基于特征值及特征向量计算的方法将其扩展成K 周期形式,讨论了其在数字水印中的应用。其次,设计了一种折线消波的自相关函数的基音检测方法,该方法的准确性优于中心消波的自相关函数法;另外,用线性预测的最大似然估计法进行基音检测,其准确性和鲁棒性也较以前的方法有所提高。再次,推导了周期信号的分数自相关函数,为突出峰值特性,将其推广为广义分数自相关函数,并用于基音检测。实验表明,方法在准确性和鲁棒性方面均优于自相关函数法。最后,在传统倒谱的计算过程中,用分数傅立叶变换取代傅立叶变换,进行推广的倒谱分析,得到分数倒谱;
并实验对比了清、浊音的分数倒谱。类似地,将Mel 频率倒谱系数推广到分数形式,测试了在不同变换阶次下说话人的正确识别率。结果发现,在我们实验范围内,分数Mel 频率倒谱系数在这方面应用的性能与Mel频率倒谱系数相比,并没有明显差异。
其他文献
本文通过定性分析传统激励生成机制和受限随机(Directed-Random)向量生成机制的优缺点,选择了受限随机向量生成机制作为搭建DMAC验证环境的激励生成机制。可重用性能够降低验
探地雷达是一种新型有效的浅层地下目标探测设备,广泛应用于考古、矿产资源勘测、岩土勘测、地雷探测、无损探测及工程建筑物结构调查,正在发挥着越来越重要的作用。本文一方面
本文对G.729语音编码算法的基本原理和实现系统开发方面进行了深入研究。针对G.729语音编码算法在实际应用中存在的一些问题,在大量分析和实验的基础上,提出了新的改进算法。
(接上期)rn3 大企业平台化转型的典型案例3.1 五星控股——打造赋能中小企业的生态化平台rn五星控股的创业团队曾经成功缔造了中国家电零售连锁著名品牌“五星电器”,2006年
束流测量系统是加速器调试和运行的重要诊断手段,利用束流测量系统进行各种束流参数的测量为加速器研究和完善提供了重要依据。合肥光源二期工程的改造目标是保证加速器长
S波段(频段:2~4GHz)单片低噪声放大器和混频放大器是雷达接收机中重要组成部分,是实现接收机高性能、小型化、低成本的关键技术。其应用领域正不断扩大,已广泛应用于通信,雷达,航
Dexamethasone has been shown to inhibit vascular smooth muscle cell (VSMC) migration, which is required for preventing restenosis. However, the mechanism underlying effect of dexamethasone remains unk
铜作为金属材料,因其具有良好的化学性质和导电特性,在微电子工业生产中扮演着越来越重要的角色。Cu薄膜的微观结构,如晶体学取向、晶界类型和残余应力等等均会直接影响着电子元器件的可靠性和寿命。纳米Cu薄膜不仅保留了纯铜原有的特性,而且具备着比纯铜更好的物理和化学特性。因此,纳米Cu薄膜是一种非常有应用前景的薄膜材料。本研究采用电阻加热蒸发法在不同的条件下制备了纳米Cu薄膜,并用快速退设备对纳米Cu薄膜
将计算机图像处理技术与现代医学相结合是目前医学图像处理的主要研究方向,它可实现医学上的计算机辅助症断与治疗。将这一先进技术应用于整形外科领域,可以进行手术设计与模
<正>要在地铁空间去营造、建立一个属于地铁媒体平台独有的场景模式,首先我们需要足够的机会和足够的厚度,而后我们的场景机会一定要具有差异化。户外广告的场景优势非常明显