论文部分内容阅读
基于内容的音乐信息检索(Content-based Music Information Retrieval,CBMIR)逐渐成为语音处理、信息检索、模式识别领域研究的焦点。在基于内容的音乐检索技术的相关研究中,特征的提取与表达、旋律相似度的计算与和匹配机制的选择将直接影响检索的准确性和效率。在本文的研究工作中,应用RAPT算法实现音乐基音频率的提取,MOMEL算法实现宏观旋律建模,提出并实现最长匹配子序列(Longest Matched Subsequellce,LMS)旋律相似度计算机制,整体算法具有更高的准确性和效率。
本文的研究主要围绕音乐特征的提取与旋律相似度的计算进行展开,主要的创新性工作如下:
1)提出旋律的表示模型。在分析对目前音乐特征提取与表达方法的基础上,确定以相邻音之间的半音音程构成的特征序列;采用RAPT算法实现音乐基音频率的提取,以MOMEL算法实现宏观旋律轮廓建模,并以基于十二平均律的对数转化作为技术实现的特征提取与表达方法,提高了算法的鲁棒性并降低了音乐特征的维度。
2)提出LMS算法,实现旋律相似度计算。在音乐相似度及旋律匹配机制的研究基础上,通过深入研究编辑距离、最长公共子串、动态时间扭曲、几何曲线拟合等诸多方法,利用动态规划策略,成功实现了LMS旋律相似度算法,解决了匹配过程中旋律片断与全曲信息难以匹配、特征序列过分拉伸、局部元素匹配失败、时间复杂度过高等问题。
3)基于LMS设计旋律匹配机制。基于LMS算法,文本提出了一种匹配长度占比、匹配部分最短编辑距离的复合相似度评估机制,融合了整体评价和局部评价,使得匹配算法具有更高的精度。且此机制具有很好的延展性,可扩展于其它领域。
4)集成以上方法,设计基于内容音乐检索系统原型。通过基于MIDI格式文件构造Sql sever歌曲数据库,并利用C#.net建立实验平台对提出的特征提取方法、相似度计算算法、匹配机制进行验证,并对整体试验结果进行分析。