论文部分内容阅读
物种鸣声中含有可以识别的物种特异信息,鸟类鸣声可被用于物种识别与鉴定,但当前最常用的频域特征Mel频率倒谱系数(MFCC)对鸟类鸣声的高频信息描述不充分,而且不能反映鸟类鸣声的时域特征。针对此,我们结合Mel频率倒谱系数和逆Mel频率倒谱系数(IMFCC)在高频段和低频段互补的特性以及短时能量在时域特征上的重要作用,提出了一种适用于鸟声识别的新特征Mix特征。本实验以4种柳莺为研究对象,分别提取其鸣声样本中的MFCC特征、IMFCC特征、M IM特征(MFCC特征与IMFCC特征的结合)和Mix(MFCC、IMFCC和短时能量的结合)特征,并以支持向量机为分类识别模型经三折交叉验证来进行分类。结果表明,我们所提出的新特征可以获得比传统MFCC特征和IMFCC特征更好的识别效果,最高识别率可达95.4%。 我们还采用层次聚类分析方法研究了云南柳莺(Phylloscopusyunnanensis)不同地理种群之间的关系,将录自北京、甘肃、四川和陕西7个地区共117段云南柳莺的鸣唱样本分别提取短时特征Mel频率倒谱系数(MFCC),利用系统聚类方法,构建云南柳莺不同地理种群鸣声特征之间的树状关系图,并对云南柳莺地理鸣声差异产生机制的可能因素(地理距离、海拔等)进行探讨。这是基于鸣声短时特征的物种识别在研究同一物种不同地理种群关系中的首次尝试。结果显示其鸣声地理差异与距离之间没有显著差异(Pearson,r=-0.036,p=0.762,n=117),但与海拔存在显著的相关性(Pearson,r=-0.836,p<0.001,n=117)。