复杂环境下基于深度学习的人体动作识别

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:hnyqk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
快速有效地识别视频中的人体动作,具有广泛的应用前景及潜在的经济价值。但目前视频动作识别方法易受到运动人体晃动、背景变化、摄相机抖动、运动人体阴影等背景因素影响。如何在复杂场景下准确地进行动作识别成为了计算机视觉中的热点问题。本文使用深度学习方法,经过对已有视频动作识别算法的充分调研后展开研究,具体工作和创新点如下:
  1) 针对目前的双流卷积神经网络无法将空间线索和时间线索有效地关联起来的缺陷,本文从特征融合的角度出发,提出了交互时间段网络(ITSN)。就特征的融合本文提出了多种可行的方法,通过对各种融合方法进行的详细对比实验,证明了双流在学习过程中的信息交互确实有助于学习,以及时间流网络更依赖于空间流网络的特征。
  2) 针对包括人体晃动和背景变化在内的各种复杂场景,本文引入经典的非局域均值降噪法,提出了非局域时间段网络(NLTSN)。非局域时间段网络的核心是非局域模块,非局域模块以特征图为输入,通过非局域卷积核计算所有点之间的点相关矩阵,由此调整原来的特征矩阵,并利用残差学习使得调整过程可控。在将非局域方法与注意力机制进行了详细的对比之后,本文发现了其内在的一致性。对各种卷积核函数进行的对比实验,证明了非局域方法的有效性以及使其起作用的是结构,而不是具体的表达方式。
  3) 最后我们把以上两种方法相结合,提出了注意力交互网络(AIN)。注意力交互网络利用对变化更敏感的光流特征图的点相关矩阵来调整 RGB 特征图的特征矩阵,使模型进一步聚焦于真正有效的区域,从而增强对视频复杂静态背景的鲁棒性。在UCF101数据集上的实验证明我们的方法获得了一加一大于二的倍增效果,并且不逊色于其他先进的方法。
其他文献
无人机应用越来越广泛,各种无人机服务于军事民事领域。有研究发现高度组织的蜂群可以完成远远大于单体所能完成的复杂任务。蜂群是今后无人机发展的必然趋势。考虑电力驱动无人机蜂群,蜂群是否稳定运行受限于成员无人机的可用状态。无人机不可用的原因一般是能量缺乏。本文考虑在蜂群执行任务期间,为其补充电力来维护稳定。基于这个问题,做了如下研究:(1)提出使用射频对蜂群无线充电。射频充电设备为低电量无人机充电以增加
学位
计算机软件系统已经在国防、金融、通信、医疗等安全关键领域中得到大规模应用。这些领域中的许多软件是采用C语言开发,在享受C语言高效的运行效率的同时,还需要承担C语言指针操作带来的内存安全风险。为了构建高可信的软件系统。许多面向C语言的内存安全检测工具被广泛使用,这些工具使用代码插桩来实现内存安全错误的运行时检测。但是,这些内存安全检测工具及其算法都没有经过严格的正确性证明,这带来了两个问题。第一,插
学位
集成学习在解决时间序列预测问题方面显示出强大的优势,如何从集成系统中选择合适的基学习器集合是集成剪枝技术中需要研究的问题,适当的集成剪枝可以使模型的预测能力更强。集成剪枝可以有效克服传统集成学习的一些缺点,例如相对较高的时间和空间复杂性。然而,每个基学习器都有其独特的预测能力。一个基学习器可能在某些样本上表现不佳,但在其他样本上表现出色,盲目低估特定基学习器的作用是不合理的。为每个待预测样本选择最
学位
云计算通过将硬件资源抽象成虚拟资源,为用户提供可弹性伸缩的按需获取的服务。随着越来越多的应用与服务部署在云端,用户对云计算可靠性的要求越来越高,且云数据中心的资源虚拟化、快速弹性架构和应用托管等复杂特性导致云数据中心容易出现异常和故障。因此,对可靠性的要求越来越高。如何保障云数据中心的可靠性,提高云计算系统提供无故障服务的能力成为亟待解决的问题。本文主要针对云数据中心计算资源的可靠性保障技术进行了
学位
在网络功能虚拟化(Network Function Virtualization,NFV)环境下,服务功能链(Service Function Chaining,SFC)通过连接一组有序的虚拟网络功能(Virtual Network Function,VNF)定制某种网络服务,可以灵活地提供网络服务。但是,目前SFC仅仅通过定义VNF的执行顺序来定制网络服务,而没有考虑VNF的运行参数、运行时序等
学位
随着移动智能设备的普及和云计算技术的快速发展,移动云计算进入了人们的生活。移动云计算解决了移动终端计算性能不佳、存储容量较小等问题,但是随着用户规模的不断扩大,移动云计算也面临着资源管理方面的挑战。为了应对这些挑战,很有必要开展移动云资源调度与管理技术的研究。本文在分析了行业需求和研究了相关关键技术的基础上,做出的主要研究工作如下:(1)针对移动云数据中心的高能耗和资源利用率较低的问题,本文改进了
移动设备不断地发展和进步,移动设备的使用频率越来越高,其安全性也越来越受重视。各类身份认证机制出现来解决移动设备的安全问题,保护用户的隐私数据。目前,移动设备的身份认证机制大部分属于显式身份认证,仅针对于移动设备的单次解锁,不保证解锁设备后移动设备的安全性。本文以移动设备的持续身份认证为研究对象,从单生物特征和多生物特征两个角度展开了研究。改进了基于运动传感器的持续身份认证,同时提出了基于运动传感
时间序列预测在科学和社会的各个领域起着重要的作用。然而,随着信息时代的到来,各类时间序列数据层出不穷,采样频率也越来越高。如此巨大的数据量中,非平稳和多变量性质的存在加剧了预测的挑战性,许多传统的预测模型已经无法胜任现在的预测任务。现有的基于循环神经网络的深度学习模型,尤其是基于长短期记忆(LSTM)和门循环单元(GRU)的循环神经网络已获得了令人印象深刻的预测性能。然而,尽管LSTM结构上更为复
学位
物联网与5G技术的蓬勃发展,导致移动终端设备产生海量的数据。数据资产催生出众多新型应用,但是移动终端设备计算资源不足与云端处理能耗过高致使移动云计算的固有缺点开始暴露,当前的云计算架构面临重大挑战。移动边缘计算(MEC)的出现为上述问题提供了解决方案,在靠近终端处提供计算与存储资源,边缘服务器既可以处理终端的上行任务,又能承接云端下放服务。终端任务可以选择卸载到边缘服务器上执行,终端设备只需发送服
学位
在当前的移动应用程序开发中,新兴涌现出的Dev Ops实践(例如,持续交付,集成和用户反馈分析)和工具正在变得越来越普遍。例如,在软件发布周期中,用户反馈的集成(以用户评论的形式提供)代表了移动应用程序维护和发展的宝贵资源。为了充分利用这些资源,开发人员急需要在用户评论和需要更改的软件产品(例如源代码和文档)之间建立语义链接,从而根据用户反馈定位到潜在需要更改的文件。此外,随着移动应用市场的快速发
学位