基于GMM的流行音乐情感识别研究

来源 :第十届全国人机语音通讯学术会议 | 被引量 : 0次 | 上传用户:yurui4010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音乐携带了大量的情感信息,音乐情感的识别已经成为人们关注的研究热点。对于它的研究在音乐数据库管理、音乐检索等方面有广阔的应用前景。本文提出了一种新的基于GMM的流行音乐情感识别研究方法; 建立了流行音乐数据库; 并采用Thayer情感认知模型,分析并提取了声学层和旋律层情感特征参数,用于不同类别的情感分类实验。实验结果表明针对本论文采用的数据库的第一层次两类情感的类正确率平均达85[%]以上,针对第二层次四类情感的分类正确率达65[%]以上。进一步引入模糊理论,实现了音乐片断的情感成分分析。
其他文献
安居方能乐业。在2008这个奥运年里,许多都市人按照自己的资金实力,都将有各种各样的购房打算。透过这些打算,可以发现,都市人如今购房更理性了,生活更讲究品位和格调了。 L
本文中,我们对现有语音转换方法进行分析,并针对频谱弯曲方法相似度较低的问题,将频谱弯曲与单元挑选相结合以提高与目标人频谱细节上的相似度。我们首先利用频谱弯曲来获得弯曲
流利度评分是目前计算机辅助自动发音评分系统中一个重要组成部分。为了解决流利度特征表述中和内容、韵律等高级表述技巧相关的广义流利问题,该文提出了一种能够全面客观地评
会议
传统的语音识别置信度方法基于各种静态特征进行分类判决,而忽略了词与周围环境之间的关系所携带的信息。为了进一步提高置信度特征的分类性能,本文提出了上下文环境、动态环境
会议
本文描述了一个与文本无关的说话人确认系统,并对前端处理作了实验研究。运用动态特征提高参数的鲁棒性。针对测试环境和训练环境的失配,采用RASTA滤波进行信道补偿。实验结果
会议
文本分类技术是近年来自然语言处理研究领域的一个热点,向量空间模型(VSM)是文本分类的经典模型,该模型在应用时假设词与词之间是相互独立的,忽略了任何词序上的相互关系,但是在
在混响时间为0.5秒到6.0秒的范围内,在实验室模拟条件下测量了汉语普通话单音节清晰度与混响时间的关系。对混响条件对单音节声、韵、调的影响分别进行了分析和讨论。以本文的
在语音通信系统中,由于信道频带的限制或编码的原因,语音的频带被控制在0.3kHz~3.4 kHz的范围内,这损失了语音的质量和可懂度。近年来,语音频带的人工扩展应运而生,也就是在接收端
人耳听觉系统在噪声条件下具有自动语音识别(ASR)系统无法比拟的优良性能,将代表人耳时频处理特性的听觉模型应用到ASR系统中有望提高系统性能。语音信号是一种非平稳信号,而分
该研究通过声学实验系统地考察了汉语中,由"是"和"连"标记的焦点成分的语音特征。研究指出:⑴ 由"是"和"连"所标记的焦点成分,对音高和时长作用的相同点表现在,将焦点位置音高显
会议