基于3D卷积神经网络的行为识别方法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:slientlamb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别在智能视频监控、客户类型、购物行为分析等现实生活中有着广泛的应用需求,然而由于杂乱的背景、遮挡和视点变化等因素的影响,准确的识别、分析现实场景中人体的行为仍然是一个具有挑战性的问题,所以开发出一套先进的行为识别算法就有着至关重要的作用。传统的行为识别方法主要由两步组成,第一步是提取视频图像的特征,第二步利用学习的分类器对特征进行分类。在真实场景中,不同的行为在外观和运动模式上有明显的不同,因此很难选择合适的特征,而深度学习模型可以通过样本学习特征,从而具有比传统行为识别方法更好的优势。本文就是在深度学习理论的基础上,提出了一种基于3D卷积神经网络的人体行为识别方法。主要由以下部分组成:首先,本文构建了一种3D卷积神经网络模型(C3D)、训练并提取C3D卷积神经网络特征;其次,在C3D卷积神经网络的基础上构建基于运动轨迹的3D卷积神经网络(TC3D)、训练并提取TC3D卷积神经网络特征;然后,把视频的光流图像送入VGG16网络模型中提取时域特征;最后,把C3D卷积神经网络特征与时域特征进行融合,送入SVM进行类别划分,最后对实验结果测试、分析以及展望。本文在UCF101数据集上进行了测试,未使用预训练模型时,C3D网络模型准确识别率为43.171%,TC3D网络模型准确识别率为38.92%,降低了 4.251%;使用预训练模型C3D网络模型准确识别率为79.1551%,VGG16网络模型准确识别率为68.5961%,而将C3D特征与时域串行特征融合准确识别率为88.5547%,相较于C3D提高了 9.3996%,加权融合准确识别率为87.1545%,相较于C3D提高了 7.9994。结果表明,TC3D不能更好的学习行为特征,而C3D特征与时域特征的融合能提高准确识别率,有较好的鲁棒性。
其他文献
随着我国用电负荷的日趋增高,给电网络的安全性带来了更严峻的挑战。大型电网络结构中存在某些关键性线路,对连锁故障及其蔓延导致全网崩溃起着至关重要的作用。因此需要一种
Ad Hoc网络作为一种新兴的无线网络,已经被广泛地应用于军事、民用以及商用等各个领域。但是,Ad Hoc网络固有的特征使其面临比传统网络更为严峻的安全问题。安全问题成为Ad H
视频图像是移动机器人感知环境的重要手段,其传输方法和性能影响到机器人操作人员的工作质量。与普通视频传输不同,移动机器人视频传输面临无线传输带宽的约束,尤其是低带宽
随着科技的飞速发展,计算机技术和无线通信技术也越来越成熟。无线网络开始越来越广泛的应用在人们的日常生活中。与传统的有线网络相比,因为没有了网线的限制,无线网络更加
21世纪是一个信息时代,随着科学技术的飞速发展,以无线传输方式传递信息已成为时代的主题。频率可重构天线通过加载一个或者多个可控器件改变天线的结构,使天线的工作频率在
准确的地震子波估计技术对于高分辨率、高信噪比、高保真度的地震勘探数据处理具有极为重要的意义。新兴的非线性优化方法进一步增强了统计性地震子波提取技术的应用潜力。针
网络中任何资源都有可能发生故障,为了提供一个高可靠性的网络,MPLS故障恢复机制能在网络故障发生后,快速进行修复。随着实时业务在网络中的大量应用,MPLS故障恢复机制已成为
工业零件的缺陷检测和尺寸测量是生产自动化和智能化的重要步骤之一。而目前大多数已实现的测量系统都只是简单的对某一类规则零件进行尺寸测量,并无集成多种零件类型的尺寸
油气管道防腐对于延长管道使用寿命及保障能源运输至关重要,阴极保护法是公认的防止金属电化学腐蚀最有效的方法。恒电位仪作为阴极保护电源,被广泛应用于埋地金属管道的防腐
人们在进行信息的交流、处理、传输和保存时,往往通过声音、图像以及文字和视频,其中图像是最能直接表达和接受的视觉信息。但是,在图像的接受、传输和保存的过程中,经常会受