【摘 要】
:
语音情感识别是语音处理领域一个具有挑战性并且具有广泛应用前景的研究课题.本文探索了语音情感识别中的关键问题之一:生成情感识别有效的特征表示.我们从四个角度生成了语音信号中的情感特征表示:1)低层次的声学特征,包括能量、基频、声音质量、频谱等相关的特征,以及基于这些低层次特征的统计特征.2)倒谱声学特征根据情感相关的高斯混合模型进行距离转化而得出的特征.3)声学特征依据声学词典进行转化而得出的特征.
【机 构】
:
中国人民大学信息学院计算机系,北京,中国,100872 中国人民大学信息学院计算机系,北京,中国,
论文部分内容阅读
语音情感识别是语音处理领域一个具有挑战性并且具有广泛应用前景的研究课题.本文探索了语音情感识别中的关键问题之一:生成情感识别有效的特征表示.我们从四个角度生成了语音信号中的情感特征表示:1)低层次的声学特征,包括能量、基频、声音质量、频谱等相关的特征,以及基于这些低层次特征的统计特征.2)倒谱声学特征根据情感相关的高斯混合模型进行距离转化而得出的特征.3)声学特征依据声学词典进行转化而得出的特征.4)声学特征转化为高斯超向量的特征.我们通过实验比较了各类特征在情感识别上的独立性能,并且尝试了将不同的特征进行融合.我们比较了不同的声学特征在几个不同语言的情感数据集上的效果.在IEMOCAP数据集上,我们的系统达到了71.9%的正确识别率,超越了之前在此数据集上报告的最好结果.
其他文献
本文就高效聚光太阳能(CSP)集热技术在克拉玛依工程教育基地热力系统中的应用进行了阐述.根据克拉玛依工程教育基地规划,聚光太阳能系统主要为热水生产装置提供热能,与锅炉房独立互补的为生活区提供热水。整个聚光太阳能热力系统可看做由热循环系统、水循环系统及生活热水输出系统三部分功能组成。镜场将当地的太阳能传递给了载热体,载热体经管线运输到热交换区与冷水进行的热交换。换热后的载热体由泵重新打回镜场内的回路
随着科学技术的发展,国家越来越重视新型能源的开发利用.现阶段,国家正面临着资源短缺的严重问题,特别是部分常规能源和不可再生资源.热能动力工程建立在工程热物理学科的基础上,通过研究内燃机和其它新型动力机械及系统,再运用工程力学、机械工程学和微电子技术学等高科技学科内容将燃料的化学能和液体的动能安全高效低污染甚至无污染地转换成动力.随着我国社会的发展以及科学技术的不断进步,人们对于热能动力工程的研究也
热力外管设计中,一般优先考虑自然补偿,如L型、π型、Z型等,有些情况自然补偿条件不满足,就要考虑用补偿器。在众多补偿器中,波纹补偿器较为常用,补偿量大、刚度小,使用它可以有效的减少管道热应力,简化配管,节省空间。热力外管用补偿器分为三大类型,即轴向型、横向型、角向型。补偿方案一般根据管道走向、空间条件、支承方式和分段方法等因素来确定。使用波纹补偿器对管道进行分段热补偿时,一个管段内原则上只能设一个
随着城市污水处理规模的增大,越来越多的污水污泥如何处置的问题已越来越受到重视.污泥干化焚烧技术因其减容、减重率高,无害化处理彻底,已成为污泥处置的一个重要发展方向。目前污泥干化焚烧的主要工艺有:对流方式传热的流化床、转鼓干燥器;传导加热方式的立式转盘、卧式转盘;对流与传导加热相结合的涡轮薄膜干化及INNO二级干化。污泥干化焚烧技术利用焚烧烟气作为热干化设备的热源,可以回收利用烟气中的能量,如果是采
同一汉字的不同时代间的变形动画可以让人们清晰的理解汉字的演化过程,更深层次地理解汉字含义.然而在不同时代的汉字变化较大,自动产生它们之间的变形动画是一个具有挑战性的任务.本文提出了一个新颖的方法来解决该问题.首先将源汉字和目标汉字分割成对应的部件,然后根据部件的骨架和特征点将其分解为笔画并建立模型,用笔画路径的相似度进行图模型的匹配来产生对应关系.最后为源汉字和目标汉字建立同构三角形,并产生插值动
率失真优化技术在视频编码的码率控制算法中占据重要位置,传统的率失真优化系统是从信号处理的角度出发来度量重建视频的失真,并未充分考虑到人的视觉特性.在人的视觉系统中,人不仅仅关注的是一个个孤立的信号点,而更关注的是信号之间的时空相关性.例如图像的局部对比度,结构基元等.并且,人对视频信号中的不同区域的失真敏感度也不相同.通常人更关注的是运动中的物体及画面的主体对象,而对背景失真的感知度会有一定程度的
理解和优化智能手机的功耗已成为一个重要的研究领域,软件和硬件开发人员均需要一个动态的功耗评估工具来指导功耗优化,从而开发低功耗的应用程序和构建省电的系统.现有的工作已经提出多种功耗模型来评估功耗,但这些模型缺乏细化粒度和精确度.本文中,我们提出基于硬件使用率和延时功耗的智能手机功耗模型,细化了模型的硬件组件,加入了延时功耗,能够更加精确地评估实时功耗.该模型基于非线性回归结构,通过模块化目标设备的
在图像分类问题中,主动学习因其可以显著降低标注训练样本的代价,已经成为一种广泛使用的方法.它的关键是样本选择策略,即在保持分类器性能的前提下,如何有效地选择少量待标注样本.同时,由于使用主动学习训练样本集合不断增长,分类器也相应地需要更新.通常,新的分类器需要使用全部的训练样本进行重新训练.显然,分类器的重训练负担将显著增加.针对样本选择策略和分类器更新问题,本文提出一种基于主动学习的在线学习器O
飞翔影院、4D动感影院等体验式影院可以让观众借助座椅等超感设备,在安全的环境下身临其境的体验到飞翔、风、云、雨、电等娱乐效果.但是,由于播放的实际是视频图像、观众多且受限于超感设备中等因素,使得这类影院很少支持观众的互动参与.本文提出一种基于多通道自然交互的体验式影院系统,通过提供群体语音和手势的自然交互方式,根据群体行为决策,实现用户与剧情互动,进行剧情选择或控制.用户测试表明,与传统体验式影院
Conventional activity recognition can be effectively captured by accelerometer data,especially for the fall caused injuries that are seriously great threats to the elderly people.Accordingly,timely de