基于卷积神经网络的运动目标检测算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:gaoyijie1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为视频分析应用中最重要的基础工作之一,运动目标检测一直被视为计算机视觉研究领域内极具实用性和挑战性的课题。虽然近年来已经有大量围绕该问题的工作不断发表,但由于自然场景的复杂变化和人为噪声的干扰,至今仍然缺乏一个通用且高效的解决方案。传统的运动检测算法主要着力于建立背景统计模型,通过寻找稳定的特征来分割运动物体。但是人工设计的特征都有其局限性,往往无法很好地适应复杂自然场景带来的挑战,例如光照的变化、目标遮挡、动态背景等等。因此本文致力于让算法自己学习到最好的特征。而近年来在计算机视觉领域得到广泛应用的卷积神经网络,由于其方法不需要研究人员手动设计特征,以及在不同的场景中表现出了很好的鲁棒性和适应性,将作为本文用于学习特征的工具。为了克服传统方法在复杂自然场景应用中的缺陷,本文围绕像素值波动和像素值时序分布展开研究,分别建立了两种运动检测模型,其中主要工作如下:(1)在基于像素值波动学习的模型(DPVL)中,本文提出了一个像素片特征用于对像素值波动进行编码。并设计了一个端对端的全卷积神经网络,通过该网络对单个像素点的观测值波动模式进行学习,最终将其值变换到一个线性可分的子空间内进行分类。此外,DPVL模型还从像素点周围随机采样,获得近邻像素点的像素片特征,使网络能够得到空间上下文信息的约束,从而提升模型的分类性能。(2)在基于像素值时序分布学习的模型(DPTDL)中,本文提出了一个随机像素值对比特征(CRP),用于对像素值的时序分布进行编码。并设计了一个卷积神经网络对像素值的时序分布进行学习,通过对比当前像素值与其历史观测值的差异来判定其是否为前景或者背景。对比传统的运动检测方法,本文提出的两种运动检测模型都不必受限于简单的像素模型和人工设计的特征,从而能更好地适应真实世界中的复杂应用场景。而其他基于深度学习的运动检测方法,由于其背景模型仍然依赖于传统方法,使得他们的方法受到了严重的限制。而本文提出的两种检测模型都直接对像素观测值进行建模,规避了借助传统方法所带来的限制。在多个标准数据集上进行的综合实验表明,与当前主流的深度学习和传统方法相比,本文所提出的两个模型都具有相当优秀的检测表现。
其他文献
作为锂离子电池负极材料,尖晶石型Li4Ti5O12和锐钛矿型TiO2具有优异的循环寿命和高安全性。然而,其低的电导率严重限制了它们的应用。本论文采用气溶胶-喷雾结合固相烧结的方
马克思主义新闻主体论是马克思主义新闻哲学中关于新闻主体及其主体性和主体间性的理论,是马克思主义新闻哲学中最核心的内容之一。本文以马克思主义经典作家原著为依据,探讨
抗菌肽作为新型抗生素替代品,具有广谱杀菌、增强动物机体免疫力等作用,目前已作为猪、鸡等动物的饲料添加剂被广泛应用。本文运用高通量测序技术比较分析饲喂不同剂量复合抗
创新作为推动国家持续发展的重要动力,一直都是社会所探讨的热点话题。企业是国家创新的主体,促进企业创新提升全要素生产率是实现经济高质量发展的关键,更是推动国家长久发
AP1000屏蔽厂房结构顶部有个可以满足核电厂72小时供水的重力水箱,该重力水箱为体积大约2800立方米的环形大容器,在AP1000核电厂遭遇地震动时,重力水箱内水体会产生强烈振荡,
目前水电站的装机容量日益扩大化,电站的安全稳定运行也成为技术人员首要关注的问题,因此对水轮机控制系统进行有效的辨识与控制显得尤其重要。针对常规PID控制,将滑模控制、
随着物联网和传感器技术的飞速发展,智能家居进入了人们的生活。智能家居通常是指配置了有线、无线网络以及各种先进传感仪器的居住环境。在智能家居中,通过传感器获取居民身
随着智能化和信息化技术的发展,我国各行各业都兴起了信息化智能化建设,尤其在工业制造领域和医疗领域,每天产生大量不同来源和形式的信息数据,而每一种来源和形式的信息都是
近十年,随着硬件设备GPU的并行计算能力提升,深度学习领域得到迅猛发展,其中的卷积神经网络在计算机视觉方面的研究与应用驱动着图像分割技术的向前发展。语义分割是图像分割
中国在高速的城市化进程中,出现了"千城一面"的问题,城市的地域性和异质性被抹杀,作为城市风景的"创造者",风景园林师对于原乡景观地域性的保护和发扬,具有义不容辞的责任。