基于深度神经网络的情绪识别研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:wwwvvv79
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情绪是人类对外界事物感知的反馈,反映了人际交往及决策过程等日常活动中的认知行为与状态。通过研究情绪识别的关键技术方法,能够有助于诸多人机交互系统的发展与应用,如社交机器人、医学治疗、驾驶员疲劳监视等,因此情绪识别已成为人工智能领域的一个重要研究方向。
  当前,情绪识别研究主要分为两个方向:基于人脸图像的情绪识别和基于EEG(Electroencephalogram)信号的情绪识别。由于人脸姿势、遮挡及光照不平衡等客观因素的影响,基于人脸图像的情绪识别存在识别精度低的问题。相较于人脸图像,EEG信号更加有助于识别真实的情绪状态,然而EEG信号融合时域、频域及空间域等维度信息于一体,现阶段基于EEG信号的情绪识别需要结合信号变化特性进行真实情绪状态的识别。
  本文结合深度神经网络技术,对上述两类情绪识别中的痛点问题进行了以下两个方面的研究工作:(1)提出了基于人脸区域分割的情绪识别框架。针对自然真实环境下人脸图像存在的人脸姿势不平衡及遮挡等问题,基于Unet网络提出FsNet分割网络分割出对情绪识别最有利的人脸区域,与TcNet分类网络相结合构建情绪识别实时框架;(2)提出EEG信号矩阵映射数据预处理方式,通过滑动时间窗获取固定时长的EEG信号对原始数据进行扩充,并采用ConvLSTM结构构建EERNet网络,充分融合EEG信号的时域、频域及空间域等特征提高整体识别精度。同时利用离散小波变换对EEG信号进行分解,得到Alpha,Beta,Gamma,Theta四个不同频段的信号数据,通过对不同脑部区域的划分,研究不同频段及不同脑部区域的EEG信号对情绪识别的影响。
  本文的研究结果如下:(1)所提出的基于人脸区域分割的情绪识别方法,实现了高效精确的情绪识别效果,并证实了人脸区域分割方式可以减少外在环境因素对情绪识别的影响,提升了情绪分类的准确度。与现有的方法相比,在保证识别精度的同时提升了识别效率;(2)所提出的基于EEG信号的情绪识别方法充分融合了EEG信号中的时域、频域及空间域特征,证实了采用深度神经网络进行EEG信号情绪识别的可行性。并通过对比不同频率范围,不同脑部区域的EEG信号的识别效果,说明不同波段、不同脑部区域对情绪识别的影响。
其他文献
随着互联网的不断普及与发展,越来越多的用户选择互联网作为获取信息的第一渠道。与此同时,随着全面小康时代的到来,人民对精神文化娱乐的需求日益增强促进着电影文化产业蓬勃发展。面对互联网中海量的电影及评论数据,利用情感分析技术对评论数据进行分析,挖掘评论文本中隐含的情感倾向与价值趋向,一方面为消费者作出消费决策时提供参考意见,另一方面可以帮助电影创作者了解观众喜好与市场需求,从而创造出更加优秀的电影作品
学位
“一带一路”政策的推行掀起了“汉语热”的狂潮,然而,不少把中文作为第二语言的外国学习者都遇到了汉语学习难的问题。如传统汉语学习模式单一,教学资源缺乏以及语言差异等。人类感知交流是一个多感官过程,视听多模态信息可以有效促进语言的理解与学习。智能辅助语言学习,就是通过为学习者提供有关发音器官运动的指导,增强学习者对发音的理解,更准确地掌握发音规律,从而在一定程度上有效解决了汉语学习难的问题。  考虑到
学位
轻度认知障碍(MCI)是阿尔兹海默症(AD)的前驱阶段,对轻度认知障碍所处阶段的精确诊断具有重要意义。本文旨在通过对静息态功能磁共振成像(rs-fMRI)信号进行直接分析建立诊断不同阶段(早期和晚期)的轻度认知障碍的分类框架,并通过总正确率,特异性(晚期MCI的正确率)和敏感性(早期MCI的正确率)评价其分类性能。  通过应用解剖自动标记(AAL)模板,将受试者的所有fMRI图像分割为116个感兴
差分隐私是一种严格的、可证明的隐私保护方法。与其他隐私模型相比,差分隐私可以成功抵御大多数隐私攻击并为数据集中的单条数据提供隐私保护。信息的实时发布使得越来越多的在线系统挖掘和分析个人的信息,讨论并设计更先进的差分隐私在线学习算法具有非常广泛的实践意义。但现有的差分隐私在线学习方法在适用范围上有很大的局限性,且算法的准确性较低。针对该问题,本文提出一种更通用、更准确的差分隐私在线学习方法。主要内容
学位
广告点击率(Click-through Rate, CTR)预估是在线广告推荐中的一项重要研究任务,它旨在预测用户在广告显示中点击广告的可能性。最近,随着神经网络在很多领域都取得了不错的成绩,越来越多的研究人员提出了基于神经网络的模型用于CTR预估任务中。这些基于神经网络的CTR预估模型一般只通过原始特征去学习低阶和高阶特征交互。然而,原始特征通常都是高维稀疏的这使得神经网络模型很难在大量参数下学
学位
进入21世纪以来,地理分布式的公有云平台已成为最为普及的互联网基础设施。在云平台上部署应用服务具有投入低、性能高、可移植性强等优势,目前已成为互联网公司的首选方案。然而,在进行跨数据中心的应用部署时,由于应用实时性要求高,数据中心间流量大,以及同类应用相互竞争等原因,使得跨数据中心应用的资源管理面临着网络传输实时性难以保障,网络传输费用居高不下,以及竞争环境下资源分配方案难以制定的问题。为此,本文
随着互联网和虚拟化等技术的快速发展,云计算的研究和应用发展迅猛,已经成为当前主流计算模型,为互联网服务、企业应用、科学研究等诸多领域提供多用户弹性服务。同时,云计算在应用过程中存在的问题也暴露出来,特别是“同时满足系统资源利用率与用户体验要求”的难题日趋突出,使得如何在保障用户体验的前提下优化系统的资源管理,成为当前亟待解决的重点问题。本文研究面向用户体验的云计算系统资源管理技术,围绕用户体验保障
学位
目标跟踪是指对连续图像序列,通过给定初始帧中目标的初始状态(例如位置和范围),估计目标在后续图像序列中的运动轨迹。目标跟踪是计算机视觉领域的研究热点。由于超高分辨率遥感技术的发展,从卫星视频中跟踪目标已成为可能。然而,卫星视频中的目标通常在整个图像上占比很小,与背景过于相似,因此现有的自然视频目标跟踪算法都无法在卫星视频中具有令人满意的精度。光流法能够计算像素点微小运动的光流矢量,从而提取目标的运
学位
长文本语义匹配任务因其结构复杂、语义多变,难以捕捉实体间的潜藏的依存关系,成为了自然语言处理领域学术界和工业界的研究热点。在处理突发新闻挖掘、信息流推荐等实际场景时,对匹配算法的实时性和准确性也产生了新的要求。目前工业界仍广泛采用基于序列的循环神经网络架构,在应用于长文本任务时,存在训练时间大幅增加、难以捕捉非线性上下文关系等不足。针对这一现象,本文基于Attention机制和图卷积神经网络,从长
近年来,加密货币发展迅速,其市值不断攀升,区块链作为加密货币中最重要的技术,越来越受到学术界和工业界的重视。然而,区块链系统的扩展性差,导致吞吐量极低、交易延迟长。在比特币网络中,交易吞吐量约为7TPS(Transaction Per Second),一个交易的延迟时间约为10分钟,在以太坊网络中吞吐量约为15TPS,交易延迟约为15秒。当前,在解决区块链扩展性问题方面,支付通道网络被认为是一种很