基于锚空间的音频场景识别

来源 :第十一届全国人机语音通讯学术会议 | 被引量 : 0次 | 上传用户：wangzhy1

【摘要】

：

　　音频场景是指由若干时间上相邻语义上相关的声学事件组成的，可以用特定语义标签来描述的一段音频。音频场景识别是对音频内容在这个较高的语义层次的理解和识别。本文通

【作者】

：

石自强杨静郑铁然韩纪庆

【机构】

：

哈尔滨工业大学,计算机科学与技术学院,哈尔滨,150001

【出处】

：

第十一届全国人机语音通讯学术会议

【发表日期】

：

2011年期

【关键词】

：

空间模型音频场景场景识别 Mixture Model 语义层次高斯混合模型学习方法多媒体数据

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　音频场景是指由若干时间上相邻语义上相关的声学事件组成的，可以用特定语义标签来描述的一段音频。音频场景识别是对音频内容在这个较高的语义层次的理解和识别。本文通过在长时上对音频特征进行建模，提出了基于锚空间模型的音频场景识别方法。在锚空间的构造中，本文提出了基于高斯混合模型（Gaussian Mixture Model，GMM）的锚学习方法以及基于稀疏限制的坐标分解算法。通过在实际网络多媒体数据上的实验表明，本方法能够有效的识别并检索出目标音频场景。

其他文献

维吾尔人说汉语普通话发音特点的声学分析

　　汉语语音识别技术的发展需要适应少数民族地区，即能够准确理解少数民族的汉语普通话。本文以此为出发点研究了维吾尔人说汉语普通话时的发音声学特征。选择发音时容易发

会议

维吾尔人汉语普通话发音特点少数民族地区语音识别技术维吾尔族学生准确理解实验分析

弹拨乐音的特征区分度分析

　　本文对民乐弹拨乐器和西乐弹拨乐器单音的音色进行特征描述，从特征数值统计的角度提出了一种计算特征区分度的方法，并在此基础上分析了中西两类乐器单音音色之间的差异。通

会议

乐音特征描述弹拨乐器频谱质心类乐器音色数值统计实验分析

关于房屋低层空间面积计算问题的探讨

本文主要结合自己从事房产测绘方面的工作,进行分析了房产测绘过程中遇到的一些问题,并提出了一些解决办法.

期刊

房产测量面积计算

言语呼吸韵律分析平台的设计与实现

　　本文以呼吸和语音信号为研究对象，运用呼吸带和气流气压计采集两类信号。设计了一套适用于呼吸韵律研究的参数，在此基础上用MATLAB搭建了言语呼吸韵律分析平台。主要功能包

会议

言语呼吸信号韵律研究分析平台语音信号参数韵律关系韵律层级

基于蒙科立输入法的蒙古语同形异码词研究

　　文本语料库的研制是文语转换研究的基础工作之一。本文在研制基于蒙科立输入法的“面向语音合成的回鹘式蒙古文（老蒙文）文本语料库”的过程中，遇到了同形异码字符和复合字符

会议

输入法蒙古语文本语料库回鹘式蒙古文字符转换研究语音合成研制

分析外墙保温技术在建筑工程施工中的应用

随着我国经济的不断发展,科学技术的不断进步,建筑行业也取得了良好的发展.当前,我国的建筑工程量在逐渐地增加.在建筑工程施工过程中,施工人员经常会使用外墙保温技术,这项

期刊

外墙保温技术建筑工程抗裂层施工

导演刘家成:抓住老北京的魂儿

暖阳拂过胡同里的青砖黛瓦,鸽哨划破天际,院落间传来阵阵私语——关乎家常,关乎菜蔬花草,关乎苦乐哀愁……在导演刘家成的镜头里,属于四九城的记忆,正在悄然苏醒.

期刊

基于EPG 信号的蒙古语复辅音的发音特征研究

　　本文基于动态腭位的研究方法，对蒙古语中以双唇音、舌尖音、舌面音为前置辅音的复辅音舌腭接触面积和舌位特征进行了探究。得出以下结论：⑴前置音和后置音拥有共同持阻段

会议

EPG信号蒙古语复辅音发音舌腭接触接触面积舌尖音

论建筑工程屋面防水施工技术及其渗漏补救

长期以来,房屋渗漏一直都是建筑行业的难以解决的问题,这一质量那你给人们的日常生活带来了诸多不便.为了解决这一难题,我们对建筑工程屋面防水施工的技术的研究是非常有必要

期刊

建筑工程屋面防水施工技术渗漏补救方案

宽恕的力量

她指证23岁的他是强奸犯,为此他在监狱中度过了11年。著名的麦考金案之后,DNA检测为他洗清了罪名,他得以出狱。接下来,会发生什么呢?在报复与宽恕之间,他会选择哪一个? She

期刊

罗纳德DNA就这样次见无罪证据理查我自己这一天律师协会终其一生

基于锚空间的音频场景识别

其他学术论文