基于人工神经网络的音乐和弦实时感知

来源 :第十届全国人机语音通讯学术会议 | 被引量 : 0次 | 上传用户:chenqiang_11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
和弦的识别是音乐调式分析以及自动标注的基础,也对于音乐结构分析及旋律分析等任务有重要的作用,也因此成为音乐信息检索(MIR)领域的热点之一。本文根据音乐认知心理学原理,提出一种基于人工神经网络(ANN)的和弦实时感知方法:首先,我们利用常数Q变换(CQT)对音乐信号进行时频变换,并在所得到的CQT谱上进行音符起始点检测以及音高校准,之后定义了一种全新的音级分布矩阵(PCDM)特征,最后利用ANN作为人脑认知过程的模拟并通过半监督学习方法对和弦进行感知。在多种风格音乐上进行的初步实验表明,所提出的方法以可以接受的计算时间消耗取得相当不错的识别率,是一种很具潜力的方法。
其他文献
在语音通信系统中,由于信道频带的限制或编码的原因,语音的频带被控制在0.3kHz~3.4 kHz的范围内,这损失了语音的质量和可懂度。近年来,语音频带的人工扩展应运而生,也就是在接收端
人耳听觉系统在噪声条件下具有自动语音识别(ASR)系统无法比拟的优良性能,将代表人耳时频处理特性的听觉模型应用到ASR系统中有望提高系统性能。语音信号是一种非平稳信号,而分
该研究通过声学实验系统地考察了汉语中,由"是"和"连"标记的焦点成分的语音特征。研究指出:⑴ 由"是"和"连"所标记的焦点成分,对音高和时长作用的相同点表现在,将焦点位置音高显
会议
音乐携带了大量的情感信息,音乐情感的识别已经成为人们关注的研究热点。对于它的研究在音乐数据库管理、音乐检索等方面有广阔的应用前景。本文提出了一种新的基于GMM的流行
信息咨询口语对话系统中的领域文法规则往往需要专家来人工设计。本文针对一种面向汉语口语的上下文无关增强文法,提出了一种基于句子分割的文法自动推导算法。其基本思想是:用
会议
目前 ,有相当部分妇女长期使用宫内节育器 (IUD)至绝经后仍未取出。随着绝经时间的延长 ,取出IUD的手术操作难度增大 ,若强行取器不仅会增加受术者的痛苦 ,而且容易出现并发症 ,本
区分性训练法方法是提高面向电话语音的语种识别系统性能的关键技术,基于GMM-SVM的系统是其中一种重要的识别系统。采用SVM方法在语种识别应用存在的主要问题包括:1)训练和测试
会议
送气辅音与非送气辅音是普通话辅音中的一对区别特征,在实际应用中需要寻找与之对应的特征参数。传统的M EL能量参数无法对这对特征进行有效的区别,该文在时频域使用W igner分布,提取基于W igner分布的特征参数作为送气辅音和非送气辅音的区别特征参数。经过一个较大语料库的测试,结果显示新的参数能够有效区别这2类不同的辅音,并且有较好的区分效果。
随着信息技术的快速发展,各种音频、视频数据日益增多,如何高效的定位关键信息具有十分重要的意义。本文主要基于关键词识别、文本分类等技术,设计并实现了一个针对汉语口语的语
会议
蒙古语中辅音的的送气与不送气的区别,向来解释为强弱之分,一般认为[p] [k] [t]等不送气音和[pp] [tp] [kp]等送气音的主要区别为前者气流弱后者气流强。而本文利用现代语音学