论文部分内容阅读
基于内容的音乐信息检索是当前音乐信息检索工作的研究热点。和弦行进序列作为一种鲁棒的音乐中层特征,被应用于基于内容的音乐信息检索的诸多领域。本文围绕和弦标注问题展开,重点研究和弦标注对音乐数据风格依赖的解决办法,以及如何融入语言模型模拟和弦行进的规律。
和弦声学特征的统计特性会受到训练数据音乐风格的影响,前人的工作一般是将训练数据按照风格分类,分别训练相应的风格相关模型。本文旨在设计一种风格无关的和弦标注隐马尔科夫模型,并使其在缺少音乐风格先验知识的前提下,和弦标注能力达到甚至超过风格相关的模型。基于对和弦在特征空间中分布的分析,本文验证了高斯混合模型模拟观察分布的必要性。然而,相应的和弦标注结果却并不理想。分析原因,是解码时多种类型的解码轨迹相互干扰,造成轨迹折叠现象。
针对轨迹折叠问题,本文引入基于概率潜语义分析的方法,建立高斯分量与音乐隐主题信息之间的关系,在解码时利用解码路径估计乐曲隐主题信息,限制解码轨迹。实验结果表明,这种方法可以有效缓解解码时的轨迹折叠问题,提高标注准确率。在此基础上,本文还分析了与隐主题有关的因素,发现两首乐曲具有的相同乐器越多,属于同一隐主题的概率越高。这意味着风格依赖现象的产生,与同种风格的乐曲使用相同或相近的乐器组合有关。
在和弦行进中,为保证和声的和谐性与持续性,当前和弦与上文和弦序列之间会存在一定的规律性。为了模拟这种规律性,本文将语言模型融入和弦标注工作中,使用基于统计的N元文法,模拟在给定上文各种和弦组合时,每个和弦作为当前和弦的条件概率,并将这种条件概率以语言模型得分的方式融入解码过程中。实验表明,语言模型的使用能有效地提高和弦标注结果准确率。