情感表达的跨文化多模态感知研究

来源 :第十届全国人机语音通讯学术会议 | 被引量 : 0次 | 上传用户:kongxianghua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频和音频两个模态的信息在交际过程中起着至关重要的作用,本研究关注的问题是情感表达中不同文化背景的听者对情感的感知(解码)与这两个模态(面部表情和情感声音)的关系。发音人为中国人,录制她的5个语句的7种情感(6种基本情感+中性情感)的音频和面部表情,制作三类刺激:只有音频信息(A-only)、只有面部视频信息(V-only)以及视频和音频同步信息(AV-Congruent)。听辨人为10名不会日语的中国人和10名不会汉语的日本人。对听辨结果分析发现,面部视频信息的加入有益于情感的感知,视频和音频信息在跨文化的情感解码中起着不同的作用,与情感的唤醒度arousal有密切的关系,相关距离空间分布模式说明听辨结果具有稳定性,跨文化的情感感知存在普遍的心理基础。
其他文献
本文介绍了参加DARPA GALE中文评测时,IBM开发的系统和算法最新进展。同时给出了在三个测试集上的识别结果,包括广播新闻和广播访谈类节目。结果显示,IBM GALE中文识别系统取得
利用分数阶付立叶变换(FrFT)在时频分析上的特点,提出一种新的谱减法-分数阶谱减法。首先,对每一帧带噪语音进行的分数阶付立叶变换,通过使得分数阶谱减法的信噪比达到最大从而
在语音识别领域,针对具体的任务进行分析进而挑选自适应数据,往往能够获得更好的自适应效果。本文提出一种基于任务分析的声学模型自适应方法,该方法针对特定任务,分析任务相关语
在当前的中文信息处理中,对短文本进行模糊匹配有广泛的应用。而现有的模糊匹配算法时间复杂度常常无法满足实际的在线需求。本文从索引检索代替顺序计算的思想出发,提出了基于
词图的高效生成算法是语音识别领域的重要研究课题。该文提出了一种基于词格的词图生成算法(trellis-based lattice-generating algorithm,TBLG),该算法在正向Viterbi解码生
主流商业搜索引擎主要基于关键词精确匹配技术,对于用户的输入错误,通常无法取得令人满意的检索效果。针对这一问题,结合汉语中的拼音知识,本文提出汉字相似程度的三种不同的度量
会议
冬季有不少有碍健康的生活习惯常被一些人误认是正确的他们做了对健康不利的糊涂事还往往振振有词自以为是试举几例戴口罩防冷 鼻粘膜里有丰富的血管和海绵状
大词汇量连续语音识别系统的性能在很大程度上取决于语音库的质量,而语音库设计的中心环节就是语料选取。本文根据古藏文音韵体系,建立了基于半音节的藏语连续语音语料库。首先
为了改变计算机必须依靠文本才能进行评分的情况,本文在国内范围内首次开展了面向大规模英语口语机考中的复述题型自动评分技术研究并证明了其技术可行性。本文首先基于连续语
会议
在实际应用中,语音情感变化的检测比单纯的语音情感识别具有更广泛的应用前景,而目前关于语音情感变化检测的研究却很少。为了实现语音情感变化检测,本文研究了基于情感分数曲线