基于深度表示学习的行为识别研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:dantezb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行为识别是计算机视觉领域的一个重要分支,在机器人视觉、智能视频监控、人机交互、医疗护理、虚拟现实及游戏控制等领域有着广泛应用前景,其研究目的主要是让计算机通过摄像机理解视觉场景中的人在干什么。为避免传统行为识别方法中繁琐的特征提取及选择编码过程,本论文结合卷积神经网络和递归神经网络分别在空间结构和时变动态信息提取方面的优势,针对行为识别研究中基于人体骨架的行为识别和基于RGB视频的行为识别两个研究问题,基于深度学习构建模型以自适应提取序列中的时空信息表达,基于获取的表达来解决这两类行为识别问题。本论文主要工作概括如下:  通过将人体骨架序列转化为对应的图像表达,利用卷积神经网络提取其中的空间结构信息以间接获取原始骨架序列的时空信息表达,在此基础上解决行为识别问题。该模型是一种端到端的、简单、高效、高精度的基于人体骨架序列的行为识别模型。  将人体结构的物理相关性约束同递归神经网络结构设计结合起来,提出层级化递归神经网络模型,通过局部特征提取及层级化特征融合来获取骨架序列中的时空信息表达,从而解决单视角场景下基于人体骨架序列的行为识别问题。随后根据该模型特点,在其训练过程引入随机旋转及尺度变,使网络通过对一定范围内任意视角下人体运动的时变动态分析来自适应学习行为类别独立于视角变化的运动模式,以解决多视角场景下基于人体骨架序列的行为识别问题。总体上,该模型是一种端到端的、高精度、高效率的基于人体骨架序列的行为识别模型,并对输入噪声、局部遮挡及摄像机视角变化具有很强的鲁棒性。  基于卷积神经网络和递归神经网络分别在提取空间静态和时变动态信息表达方面的优势,结合门控思想来解决递归神经网络训练中的梯度消失和误差膨胀问题,提出卷积递归神经网络模型来同步自适应提取视频中更具区分性的时空信息表达,以更好地解决基于RGB视频的行为识别问题。
其他文献
家庭网关是智能家居系统的监控核心,是保障系统安全稳定运行的关键。本文针对嵌入式家庭网关的系统设计进行了理论研究和实践,并探讨了其在家居系统中的具体应用。  本论文的
本研究课题的试验主体是对LGM-15/45轿车轮毂轴承的性能测试,研究的主要范围包括软件的设计、硬件的选型和搭建、控制理论方法的选择及控制参数的优化,如何进一步提高测试系
本论文对遗传算法的运行机制进行了研究,综合应用遗传算法和惩罚函数法相结合的最优化理论和技术,进行了污水处理过程优化控制遗传算法程序的设计和模拟仿真。仿真结果表明:在某
本文以首钢三炼钢生产组织为研究对象,研究静态计划编排算法,并以算法为基础设计并开发计划编排辅助系统,指导炼钢连铸车间生产。 结合首钢三炼钢生产作业特点,本文研究静态计
随着操作系统和应用系统的不断发展和广泛应用,其规模越做越大越复杂,其可靠性和可用性也越来越难以保证。通常在整个系统中,软件故障所引起的系统运转中断远远高于硬件故障。软
本课题以肉类新鲜度检测为研究对象,以数据融合为理论基础,对发展应用较为成熟的人工神经网络技术及基于神经网络的数据融合技术进行了分析研究。在分析了肉类变质机理的基础上
由于人类生活于地球大气的边界层,人类的所有活动都受到边界层大气变化的影响,所以探测边界层大气的变化就显得尤为重要。而低空探测是人们研究边界层大气运动规律的一种常用方
地物分析是指利用观测数据认识地球表面物体性质的过程,可广泛应用于资源勘查、土地规划、灾情防治诸多方面。数字高程模型(DEM)和多光谱图像是进行地物分析的两种重要数据源,
本文在分布式人工智能和Agent技术的基础上,以国家旅游局金旅工程为应用对象,对Agent技术在分布式智能信息系统中的理论与应用进行研究。论文的主要工作和创新点如下:①提出并建
模式分类是人工智能的一个基础研究领域,是从数据中获取有效信息的一个重要手段。各种各样的分类器被相继提出,并被广泛地用于解决许多实际问题。在实际的分类问题中,存在两种常