基于旋律相似计算的音乐检索研究

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:zhuyanyan09eight
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的音乐信息检索(Content-based Music Information Retrieval,CBMIR)逐渐成为语音处理、信息检索、模式识别领域研究的焦点。在基于内容的音乐检索技术的相关研究中,特征的提取与表达、旋律相似度的计算与和匹配机制的选择将直接影响检索的准确性和效率。在本文的研究工作中,应用RAPT算法实现音乐基音频率的提取,MOMEL算法实现宏观旋律建模,提出并实现最长匹配子序列(Longest Matched Subsequellce,LMS)旋律相似度计算机制,整体算法具有更高的准确性和效率。   本文的研究主要围绕音乐特征的提取与旋律相似度的计算进行展开,主要的创新性工作如下:   1)提出旋律的表示模型。在分析对目前音乐特征提取与表达方法的基础上,确定以相邻音之间的半音音程构成的特征序列;采用RAPT算法实现音乐基音频率的提取,以MOMEL算法实现宏观旋律轮廓建模,并以基于十二平均律的对数转化作为技术实现的特征提取与表达方法,提高了算法的鲁棒性并降低了音乐特征的维度。   2)提出LMS算法,实现旋律相似度计算。在音乐相似度及旋律匹配机制的研究基础上,通过深入研究编辑距离、最长公共子串、动态时间扭曲、几何曲线拟合等诸多方法,利用动态规划策略,成功实现了LMS旋律相似度算法,解决了匹配过程中旋律片断与全曲信息难以匹配、特征序列过分拉伸、局部元素匹配失败、时间复杂度过高等问题。   3)基于LMS设计旋律匹配机制。基于LMS算法,文本提出了一种匹配长度占比、匹配部分最短编辑距离的复合相似度评估机制,融合了整体评价和局部评价,使得匹配算法具有更高的精度。且此机制具有很好的延展性,可扩展于其它领域。   4)集成以上方法,设计基于内容音乐检索系统原型。通过基于MIDI格式文件构造Sql sever歌曲数据库,并利用C#.net建立实验平台对提出的特征提取方法、相似度计算算法、匹配机制进行验证,并对整体试验结果进行分析。
其他文献
相比于网格计算,云计算引入了虚拟机技术,这提高了资源的利用率,同时也引起云计算资源分配过程两层化:将任务分配至虚拟机(Vm)、将虚拟机映射至主机。第一层分配直接影响任务
支持向量机(SVM)是在统计学习理论基础上开发出来的一种新的、非常有效的机器学习新方法。它较好地解决了以往困扰很多学习方法的小样本、非线性、过学习、高维数、局部极小
随着互联网技术的迅速普及和互联网技术应用的发展,网站已经成为各个领域进行自身推广和宣传的重要手段。在信息量剧增,信息表现形式多样化的今天,如何建设成一个既方便信息管理
互联网、多媒体技术以及对视频的大量研究推动着视频压缩技术的不断发展。由于网络带宽的限制,视频信息的实时传输要求有高效视频压缩编码技术作为基础。运动估计技术可以有
由于工区中采集的井点数据比较少,应用一些常规插值方法,如反距离加权法,插值效果不理想。本文采用普通克里金估计技术进行插值,取得较好效果。普通克里金只使用了井点数据,而工区
人脸识别技术作为一种被广泛接受的生物特征识别技术,具有重要的理论价值和广阔的应用前景。经过几十年的发展,人脸识别技术取得了长足的进展。大量的性能评测与学术研究表明,在
地球上的水处于不断地循环之中,水在不同阶段的循环过程便构成了大气水循环。土壤蒸发是大气水循环中十分重要的一个环节,它涉及到土壤水运动(如入渗、壤中流等)、能量平衡、
物联网是一种可以将任何商品与互联网连接起来,按约定的协议进行信息交换,实现智能化识别、定位、跟踪、监控和管理的一种网络。物联网中的信息流通能够通过对商品的唯一标识
随着现代社会的信息化,身份识别及验证已经引起了广泛的研究热潮。一个人的身份识别及验证包括多种手段,例如指纹识别,瞳孔识别,印章识别及本文的研究方向签名识别。其中,签
三维数据场的体绘制技术是科学计算可视化的重要内容。将三维数据场的体绘制技术应用于地震数据体的三维绘制,能够直接揭示蕴含在庞大数据中的地质现象与规律,帮助科研工作者详