基于锚空间的音频场景识别

来源 :第十一届全国人机语音通讯学术会议 | 被引量 : 0次 | 上传用户:wangzhy1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  音频场景是指由若干时间上相邻语义上相关的声学事件组成的,可以用特定语义标签来描述的一段音频。音频 场景识别是对音频内容在这个较高的语义层次的理解和识别。本文通过在长时上对音频特征进行建模,提出了基于锚空间模型的音频场景识别方法。在锚空间的构造中,本文提出了基于高斯混合模型(Gaussian Mixture Model,GMM)的锚学习方法以及基于稀疏限制的坐标分解算法。通过在实际网络多媒体数据上的实验表明,本方法能够有效的识别并检索出目标音频场景。
其他文献
  汉语语音识别技术的发展需要适应少数民族地区,即能够准确理解少数民族的汉语普通话。本文以此为出发点 研究了维吾尔人说汉语普通话时的发音声学特征。选择发音时容易发
  本文对民乐弹拨乐器和西乐弹拨乐器单音的音色进行特征描述,从特征数值统计的角度提出了一种计算特征区分度的方法,并在此基础上分析了中西两类乐器单音音色之间的差异。通
本文主要结合自己从事房产测绘方面的工作,进行分析了房产测绘过程中遇到的一些问题,并提出了一些解决办法.
  本文以呼吸和语音信号为研究对象,运用呼吸带和气流气压计采集两类信号。设计了一套适用于呼吸韵律研究的参数,在此基础上用MATLAB搭建了言语呼吸韵律分析平台。主要功能包
  文本语料库的研制是文语转换研究的基础工作之一。本文在研制基于蒙科立输入法的“面向语音合成的回鹘式蒙古文(老蒙文)文本语料库”的过程中,遇到了同形异码字符和复合字符
随着我国经济的不断发展,科学技术的不断进步,建筑行业也取得了良好的发展.当前,我国的建筑工程量在逐渐地增加.在建筑工程施工过程中,施工人员经常会使用外墙保温技术,这项
暖阳拂过胡同里的青砖黛瓦,鸽哨划破天际,院落间传来阵阵私语——关乎家常,关乎菜蔬花草,关乎苦乐哀愁……在导演刘家成的镜头里,属于四九城的记忆,正在悄然苏醒.
期刊
  本文基于动态腭位的研究方法,对蒙古语中以双唇音、舌尖音、舌面音为前置辅音的复辅音舌腭接触面积和舌 位特征进行了探究。得出以下结论:⑴前置音和后置音拥有共同持阻段
长期以来,房屋渗漏一直都是建筑行业的难以解决的问题,这一质量那你给人们的日常生活带来了诸多不便.为了解决这一难题,我们对建筑工程屋面防水施工的技术的研究是非常有必要
她指证23岁的他是强奸犯,为此他在监狱中度过了11年。著名的麦考金案之后,DNA检测为他洗清了罪名,他得以出狱。接下来,会发生什么呢?在报复与宽恕之间,他会选择哪一个? She