基于深度学习框架的背景减除算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:ccf107893228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着硬件和软件的蓬勃发展,视频图像这种更直观的信息,已成为传递信息的重要媒介,如何从海量的视频图像信息中找到人类所感兴趣的信息显得愈发重要。背景减除任务是计算机视觉领域重要研究课题之一,能够只保留运动的前景目标,而过滤掉信息量更大但不感兴趣的部分,即背景区域部分。近三十年来,国内外研究者基于背景建模理论等传统算法对背景减除任务做了深入研究。然而,实际应用中视频场景十分复杂,传统的背景减除算法难以保持较高的鲁棒性和优秀的检测能力。深度学习凭借其对图像数据的强大表征能力,在各计算机视觉任务中得到广泛应用,研究人员已经尝试将深度学习应用到背景减除任务中,以提高背景减除算法的检测能力和鲁棒性。目前,基于卷积神经网络的背景减除算法,取得了不错的成果,但往往会在一系列下采样和上采样之后丢失掉原图的许多细节。因此,本文提出了局部强化网络,通过采用局部强化层来恢复这些丢失的细节。首先通过两个编解码网络来得到粗糙的结果,然后再把结果作为局部强化层的输入,而局部强化层的参数将由另一个编解码网络所提供,局部强化层的输出将作为最终结果。局部强化网络在CDnet-2014数据集上得到0.9733的F-Measure值,实验结果显示,所提出的算法优于现有的一些优秀算法。在背景减除任务中,空间信息和时间信息都有利于运动目标的检测。基于深度神经网络的方法通常把现有的卷积神经网络的传统操作,如卷积长-短期记忆层(convolutional long-short Term Memory layer,Conv LSTM)、二维卷积层(2D convolutional layer)或三维卷积层(3D convolutional layer)组成的不同拓扑结构以捕捉这些信息。但同时采用了空间信息和时间信息的算法往往在CDnet-2014数据集上的总F-Measure值不超过0.97,通常不如只采用空间信息的算法,这十分违背直觉。因此,本文提出时空传播网络(STPNet),一种新的背景减除算法,其是一种采用了新颖的层的端对端网络。该层的操作过程相当于特征图与亲和矩阵相乘,用以捕获视频序列的时空相关性,并从连续帧中聚合深度特征。实验结果表明,该新层为网络聚合多尺度时空特征提供了一种替代方法,同时所提出的网络具有卓越的性能,在CDnet-2014数据集上的总F-Measure值可达0.9830,并可泛化到网络未见过的视频。
其他文献
重线性化矩阵是计算密钥的重要组成部分,虽然使用重线性化矩阵可以达到全同态加密的目的,但是带来的计算代价却是高昂的。在GSW同态加密算法中,密文的同态加法和同态乘法运算直接与矩阵运算相关。相较于其他基于带错学习的加密算法,GSW加密算法在做同态运算时无需计算密钥,从而无需执行重线性化矩阵运算,计算代价更小。然而,GSW加密算法在做加密运算时的数据量很大,而基于CPU加速方式的加密时间过长,因此如何缩
近年来,随着我国社会飞速发展,人们的生活节奏越来越快。饮食不规律、高负荷工作量和身体缺乏锻炼等问题导致心血管疾病对居民身体健康的影响愈加显著,心血管的发病率持续增高。心率是表示人体状态的一项重要的生理指标,医生能够通过心率对心血管患者身体进行评估,健康人群也可以通过心率检测预防心血管疾病的发生。基于心冲击描记术(Ballistocardiography,BCG)的视频心率检测方法在已经取得较为理想
神经网络已推动人工智能取得巨大的进展,诸如医疗诊断、自动驾驶等对可靠性要求较高的领域也正在加速引入神经网络。传统计算系统已经无法满足神经网络的规模和算力需求的日益增长,使用特定硬件加速神经网络已是时下通行的做法。基于FPGA的神经网络加速系统由于其在能效比、灵活部署等方面的优势,已被大量使用在包括嵌入式终端等在内的端到端的工业和军用场景。在这些特定的工作场景中,极端的工作环境时有出现,如车机系统中
MEMS光学加速度传感器是一种将惯性系统内部敏感质量块的位移变化,转化为光学系统中光信号的变化量(波长、频率、能量)来间接测量加速度的传感器件,具有精度高、抗电磁干扰性强等优良特点,广泛应用于飞机导航、人造卫星的姿态调整、国家基本重力网测量绘制以及石油地震勘探等领域。同时在军事领域,采用精度更高的加速度测量器件将给武器装备的性能带来极大的提升,具有极其重要的战略意义。本文设计了一种基于Fabry-
三维测量是机器视觉研究的前沿性问题,三维测量系统是机器视觉系统的重要组成部分。为了实现实时三维形貌测量和提高测量精度,研究人员提出了众多的方法。基于结构光的三维重构可以实现非接触测量,与此同时面结构光相比线结构光具有重构速度快和较高精度等优点。系统在处理一幅普通的灰度图像需要几十万甚至上百万个像素点的遍历,重建一个场景往往需要多幅这样的灰度图像,这样就大大增加了重建一幅场景所需的时间。其次,由于投
火灾是严重威胁公共安全和经济社会发展的主要灾害之一,为了有效预防和减少火灾事件所造成的损失,火灾探测技术应运而生。点型感烟火灾探测器是目前广泛应用的一种火灾探测器,其性能直接地影响到火灾预警的实时性和可靠程度,所以对点型感烟探测器的性能评估尤其重要。国家标准GB4715-2005规范了点型感烟火灾探测器的标定环境的要求,为进行同类火灾探测器的性能检定提供了依据。本文研究了点型感烟火灾探测器标定实验
目前,工业生产的需求日益增加,大量含镉废弃物以烟、渣和废水的形式向环境中排放,使其逐渐变成了影响人类健康的“公害”之一。镉是一种剧毒重金属污染物,其生物蓄积性强、半衰期长,过量镉接触会对人类的肾脏、心血管、肺、免疫系统等造成不可逆转的危害。因此,超痕量镉离子的灵敏且特异检测在食品安全和环境监测中均具有重要意义。为了解决现有重金属镉离子(Cd2+)检测技术存在的检测精度低、选择性差以及无法满足快速实
对于目前高温下的视觉测量,如何降低高温部件本身发出的辐射光以及高温气流扰动对图像质量的影响仍然是一个挑战,这在航空航天或汽车制造等领域具有重大影响。单像素成像(Single-Pixel Imaging,SPI)作为一种新的成像方法,近年来得到了较好的发展。SPI具有成本低、信噪比高、成像谱宽等优点,特别是在弱光及非可见光条件下,它具有显著的优势。本文针对高温下复杂的光学成像环境,提出了一种结合单像
近年来,卷积神经网络(Convolutional Neural Networks,CNNs)在生活中的应用变得越来越广泛。CNN模型中庞大的数据量以及计算量,也逐渐成了掣肘神经网络发展的主要因素。二值化神经网络(Binary Neural Networks,BNN)作为一种轻量型的神经网络,相比于CNN可以极大减少数据量以及计算量。基于BNN的优点,专用BNN硬件加速器的设计成为一个新的热门研究方
目前,在光学非接触测量领域,叠焦测量仍然是最具发展潜力的课题。利用运动机构实现光学系统的焦深扩展,在距离被测物体不同高度的位置采集图像序列,通过算法处理获取每一个点的最佳聚焦位置。在这个过程中,聚焦评价算法起到了重要的作用。各种聚焦评价算法在不同的使用场景下性能表现存在差异,对聚焦评价算法性能的研究有利于更好地开展测量工作。本文系统地介绍了基于焦深扩展显微成像技术的测量方法,根据叠焦原理,搭建了叠