论文部分内容阅读
随着摄像头安装数量的日益增多,以及智慧城市和公共安全需求的日益增长,采用人工的视频监控方式已经远远不能满足需要。深度学习是近十年来人工智能领域取得的最重要的突破之一。目前深度学习中的卷积神经网络方法已经在人脸识别、行人检测、图像分类等方面取得了优异的成绩,并获得了广泛的应用。本文主要对深度学习技术在溯源计算领域和其他工程领域的具体应用进行探索。针对溯源监控视频中视频信息处理的问题,通过收集建立深度学习数据集和公开数据集中训练的离线卷积神经网络模型,结合视频和采集处理技术以及web展示技术完成视频中感兴趣物体的在线检测、识别以及展示,设计出一套满足实际应用要求的智能视频监控系统。本文的主要贡献如下:1.基于目标检测的需求,在视频处理过程中,使用帧差法解决视频关键帧难以确定的问题,并使用混合高斯建模法和帧差法设计了一种运动目标检测的方法,该方法可以有效的克服前景提取过程中噪声和阴影的干扰。2.针对传统目标分类准确率不高的问题,收集溯源视频中目标集合,完成目标的分类和标注,并基于该数据集,使用深度学习平台caffe设计和训练卷积神经网络的离线模型,以提高分类的准确率。3.根据系统实现的需求,基于“运动检测+CNN”和"Faster-RCNN",使用离线训练的卷积神经网络模型,结合Redis进行数据传递和web应用平台LAMP设计和实现实时的目标检测和识别系统。最后,在以Tesla K40为基础搭建的硬件平台中,文章训练的CNN模型在溯源视频数据集中测试准确率为90.87%,“运动检测+CNN”系统对一帧图片的平均处理时间为720ms,"Faster-RCNN"系统对每帧图片的平均时间为230ms。测试结果表明,本文设计和实现的目标检测和识别系统能够满足实际应用中功能和性能方面的需求。