论文部分内容阅读
复杂背景下的目标实时分割与检测技术是计算机视觉领域的一个重要研究方向,在人机交互、智能监控和虚拟现实等领域具有广泛的应用前景。本文以视频中的目标实时分割与检测技术为研究主体,对其中的一些关键问题进行了探索和研究。论文的主要工作归纳如下:
①提出了基于区域与像素级的交互式图切分割算法。该方法将图像分割成几个区域,借助用户交互信息,建立了基于区域级的赋权图,利用区域合并的分水岭结果及邻域像素的颜色差构造Gibbs能量函数,通过图切算法(graph cut)实现前景/背景的区域分割;同时为了得到准确的前景/背景边界,在前景的边界带进行了基于像素级的二次图切分割。实验结果表明了这种交互式分割方法的有效性。
②提出了特征背景模型与高斯模型自适应融合的背景模型。该模型基于主成份分析方法建立了像素亮度信息的特征背景及色度信息的高斯模型,并设定了基于光照变化的融合机制。同时对模型分割的结果进行了阴影去除及后处理。实验结果表明融合的背景模型综合了特征背景模型和高斯模型的优势,提高了目标的实时分割精度。
③提出了基于时空连续性的实时目标分割方法。该方法首先利用提出的融合背景模型将当前帧图像分割成前景、背景和未知标签三类像素集,然后在动态图切框架下,根据颜色和对比度信息构造目标能量函数,设计了基于时间连续性信息的融合背景模型和全局前景模型的数据项,提出了基于局部二值模式(1bp)的对比度平滑项。最后通过图切算法极小化能量函数求取所有像素的二值标签。采用边界平滑和α值估计等后处理方法,使分割出的前景目标无缝地融合到虚拟背景中。实验结果表明该方法能较好地将复杂背景中的目标实时分割出来并真实地合成到虚拟背景中。
④提出了基于梯度方向直方图特征的手势检测方法。该方法利用梯度方向直方图(hog)特征提取不同手势的形状信息,用级联的Adaboost学习算法构造检测器。在检测过程中,根据前一帧检测结果确立感兴趣区域,从而实现实时的多角度手势检测。