基于内容的音频分类算法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户：kuangyunlo

【摘要】

：

随着科技的飞速发展,越来越多的图像、视频、音频等多媒体数据资料进入人们的生活,如何处理这些多媒体数据信息以方便人们使用,是信息处理领域的研究重点。音频作为一种主要

【作者】

：

冯燕

【机构】

：

北京工业大学

【出处】

：

北京工业大学

【发表日期】

：

2011年期

【关键词】

：

音频分类算法特征提取顺序后退法粒子群算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着科技的飞速发展,越来越多的图像、视频、音频等多媒体数据资料进入人们的生活,如何处理这些多媒体数据信息以方便人们使用,是信息处理领域的研究重点。音频作为一种主要的多媒体信息形式,成为信息处理领域的重要研究对象。音频分类能为音视频的检索和处理,如广播、新闻、网络的检索,语音识别,数据管理等提供有用的辅助手段。对于海量的音频信息,迫切需要一种快速有效的音频分类算法对它们进行分类和管理。　　音频数据是一种非语义符号表示和非结构化的二进制流,缺乏语义内容的描述和结构化的组织,给音频信息的分析和处理工作带来了很大的困难。基于内容的音频分类算法,通过分析音频中的结构化信息和语义内容来提取特征,对不同类型的音频数据赋以不同的语义,使具有相同语义的音频在听觉上保持相似,并选用有效的分类器来区分不同类型的音频。因此,提取能够表征音频内容的特征和选择合适的分类器,成为音频分类算法研究的重点。本文主要针对音频特征和分类器的影响,从理论和实验角度深入研究了基于内容的音频分类算法。　　首先,对音频文件进行了语义内容分析和结构分析,明确了研究的目标。在此基础上,对音频文件进行预处理,提取了基于音频帧层次和段层次的特征。针对纯语音/带音乐伴奏语音/无伴奏歌声/带音乐伴奏歌声的分类,提取了声学特征中的频谱质心、频谱延伸、高过零率比率、能量熵、低能量帧比率、频谱流量、频谱滚降,感知特征Mel频率倒谱系数,针对电鸣乐器/弦鸣乐器/气鸣乐器/膜鸣乐器/体鸣乐器的分类,提取了声学特征中的频谱质心、频谱延伸、能量熵、频谱滚降、子带基音频率分布、第一共振峰频率、第二共振峰频率,感知特征Mel频率倒谱系数。　　其次,研究了音频特征集的构造。为消除特征中不利于分类的冗余信息,采用TVN(Talker Variability Normalization)算法进行特征加权,使得特征空间中的类间距离增大,类内距离减小,提高了特征的可分性；随后利用顺序后退法进行特征选择,以支持向量机的分类准确率作为评价函数,进一步提高了特征分类的有效性。　　再次,探究了粒子群算法对支持向量机的惩罚系数和径向基核参数的寻优。粒子群算法不仅提高了寻优效率、加快了搜索速度,而且降低了对参数初始值选取的依赖程度,提高了支持向量机的分类性能。　　最后,利用训练过程确定的特征加权系数、最优特征,在测试过程中提取最优特征并对其加权,采用训练过程确定的最优参数下的支持向量机分类器,尝试研究了纯语音/带音乐伴奏语音/无伴奏歌声/带音乐伴奏歌声的分类以及电鸣乐器/弦鸣乐器/气鸣乐器/膜鸣乐器/体鸣乐器的分类,实验结果证明了本文算法的有效性。　　本课题的研究有助于音频分类技术的进步,对其它音频处理领域以及相关模式识别领域算法的研究和改进有一定的参考价值和借鉴作用。

其他文献

基于视频的人体资势预测与跟踪

基于视频的人体姿势预测与跟踪，在智能视频监控和人机交互等领域中具有广泛的应用，正获得越来越多的关注。但是，由于受到高维状态空间、复杂背景、遮挡、光照变化和外观变化等因

学位

人体资势预测跟踪算法图像特征智能视频监控

物联网的无线感知网络和无线接入网络的若干问题研究

物联网是一个复杂的异构网络,其目标是实现人与人、人与物、物与物之间的任何时间任何地点的沟通。无线网络接入是构建物联网的关键技术之一。根据功能的不同,物联网的无线网

学位

蜂窝网络物联网无线感知网络无线接入网络接入控制资源分配

基于Fuzzy Vault的人脸加密算法研究

生物特征识别技术逐渐从研究转向应用,由此而带来的生物特征的安全性和隐私性受到人们的关注。针对这一问题,将生物特征识别技术和密码学技术相结合的生物加密技术,既可以用

学位

身份认证人脸加密生物特征识别

面向无线视频传感器网络的事件检测技术研究

无线视频传感器网络融合了半导体技术、网络技术、智能化信息处理技术、数字图像处理技术等多个学科领域,是当今信息技术领域广受关注的热点研究领域。大量视频传感器节点能

学位

无线视频传感器网络多目标检测事件检测跟踪算法交通违章

论基层农产品检测室的安全管理问题

随着农产品市场、消费观念等的不断发展、升级,农产品质量逐渐成为社会大众最为关注的问题,对农产品进行检测成为农业发展必不可少的环节,而农产品检测作为食品安全的重要保

期刊

安全管理基层农产品检测室预防措施

短数据包业务特征分析与建模

随着智能手机技术和无线通信技术的发展，越来越多因特网IP业务被移植到手机上，其中具有代表性的是即时聊天应用(如腾讯QQ聊天)，微型博客(如Twitter，新浪微博)等，这类业务共有的特

学位

概率密度拟合短数据包业务业务流建模自相似on-off模型最小二乘准则资源分配

胆管结扎大鼠肠道菌群结构的分子生态学研究

阻塞性黄疸(简称阻黄)是由于肝内、外胆管的机械性因素造成的胆汁瘀积、继而导致全身多系统病变的临床病症。阻黄及其引起的并发症与肠道菌群密切相关。本文采用常规的胆管结扎方法对SD大鼠进行阻黄造模,主要对手术前后的肠道菌群结构的变化进行了分子生态学研究,并与假手术组大鼠进行比较。采集胆管结扎组(n=5)及假手术组(n=5)大鼠手术前3天,手术后3天、7天、两周共四个时间点的粪便样品,提取粪便样品的总DN

学位

胆管结扎肠道菌群ERIC-PCRDGGEPCA

基于改进关联规则和遗传算法的基因表达调控网络构建方法

基因调控网络的研究是后基因组信息学研究的主要课题之一，运用生物信息学的方法和技术，通过数据采集、分析、建模、模拟和推断等手段研究复杂的网络关系，在基因组层次上揭示生命

学位

改进关联规则遗传算法基因调控网络构建方法

多维度助力推动新教师专业成长

摘要：鸡西幼教中心于2014年5月正式开园，一线教师中新教师比例高达85 %，为让年轻教师们正确行走在幼教之路上，明幼师之责、立良师之品、做有爱之人，我们从多维度助力，成就新教师的专业成长。　　关键词：理念；关怀；教师成长；目标；方向　　一、理念上导航——树立职业理想，让教师拥有使命感　　1.凝练办园理念　　幼教工作是离良心最近的工作，是点燃、唤醒、激活高质量生命成长的原点。基于此，我们在开园前，

期刊

理念关怀教师成长目标方向

春意浓(国画)

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

国画春意

基于内容的音频分类算法研究

其他学术论文