基于粒子滤波器的目标跟踪

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:anglersss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪是计算机视觉领域中的一个具有挑战性的问题。目标跟踪的任务是根据给定的目标观测序列(信号或图像),估计目标的时变状态(动态的几何或物理属性)。目标跟踪成功的关键在于从观测序列中有效地抽取关于目标状态的有用信息。本文研究在非刚性的视觉目标跟踪应用中,非线性、非高斯的离散时间递归贝叶斯估计问题。对这一问题的研究兴趣来源于通过单个摄像机跟踪单个、多个视觉目标的问题,不管背景杂物、摄像机的运动、目标之间频繁遮挡等于扰的影响。   在递归贝叶斯估计框架下,目标状态和测量被视为随机过程,在这种条件下递归估计的概念解是以观测值序列为条件的状态的后验条件概率密度函数(目标分布)的递归表达式。在实际上,非线性的递归估计的最优解通常不可能解析计算,因为它需要计算几个没有解析表达式的积分。本文描述了贝叶斯框架下的非刚性视觉目标的跟踪问题,采用序列蒙特卡罗方法数值逼近最优而义难处理的递归解,致力于获得一种高效且鲁棒的视觉跟踪方法。本文提出了两种粒子滤波器米实现非刚性视觉跟踪问题,并解决了目标数量可变的多目标之间的消失与出现以及互相遮挡问题。本论文的主要工作有:   ①t分布粒子滤波器粒子滤波器的有效性高度依赖于重要性采样分布的选择,因此设计恰当的重要性采样分布是粒子滤波器的关键。本文基于多变量t分布设计了一种新的粒子滤波器:t分布粒子滤波器(t-distributionparticlefilter,SPF)。这种滤波器以多变量t分布有效地逼近目标状态的预测分布和滤波分布,重要性采样分布选择为预测分布(t分布)和先验分布的混合。在有限样本的条件下,为了保证多变量t分布的最大似然估计的数值稳定性,获得更好的后验分布的逼近,本文修改了ECME算法,采用了规则化的Mahalanobis距离。当样本集合中存在病态数据时,多变量t分布提供了一种比多变量正态分布更加鲁棒的拟合方法,而且t分布不会导致后验估计产生极端的状态估计。在单个非刚性视觉目标和机动目标跟踪实验中,比较了UKF、SISR以及SPF的跟踪性能。研究成果发表在”IEEEControlConference/ACC2006”和“机器人”上。   ②混合t分布粒子滤波器在非刚性的多目标视觉跟踪中,特别是在被跟踪目标的数量是随时可变的条件下,如何更新和维持目标分布的多模态性是至关重要的。本文以有限t分布混合模型(FTM)逼近多模态的目标分布,开发了一种混合贝叶斯跟踪方法来解决这个问题。这种混合跟踪方法可以按两步递归完成:混合预测和混合测量更新。基于目标分布的粒子表示,这种多目标混合跟踪方法可由混合t分布粒子滤波器(MixturesofStudent-tDistributionParticleFilters,MTPF)高效计算。考虑到被跟踪目标的数量是可变的,本文采用目标检测算法米判定是否有被跟踪目标离开和进入视场,并根据检测结果调整混合模型、增加或删除对应的粒子集,使得每个被跟踪目标对应一个混合分量。针对多目标之间的相互重叠,设计了局部特征检测算法确定各个目标的状态以维持跟踪的一致性。MTPF的重要性采样分布由每个目标的状态转移概率模型和预测分布的混合构成。本文采用了基于样本的相似性测量模型估计样本与参考之间的相似性。此外,t分布的最大似然估计由基于规则化Mahalanobis距离的ECME算法计算。在一段实时足球比赛视频中,比较了Mixturesoftdistributionparticlefilters、Mixturesofparticlefilters和theboostedparticlefilters的跟踪性能,通过实验说明本文提出的方法的优缺点。研究成果提交到”IEEETransactiononImageProcessing”。
其他文献
在实际信号处理过程中,观测信号总是混杂着干扰和噪声,对信号处理的检测与估计结果有很大影响。因此,信号处理的一个基本任务就是将混杂在噪声和干扰中的有用信号准确地检测和估
客户关系管理是一个系统性的工程,是技术和管理相结合的产物。作为企业信息化的最新发展,客户关系管理实现了企业由以产品为中心向以客户为中心的转变,客户首次作为一种资源纳入
随着数字技术与计算机技术的迅速发展,数字音频工作站(Digital Audio workstation,简称DAW)出现,并且迅速替代了传统音频工作站,在广电领域内占据重要位置。广播电台的稳定性
自动人脸识别的研究有着重要的学术价值和广泛的应用前景。本文沿着统计学习与融合的思路对人脸识别中的对齐、特征表达和分类器的训练及构造三个关键问题进行了深入的研究。
随着电子通信技术的高速发展,特别是近年来移动互联网技术的发展与普及,人们对高性能、多功能、低功耗移动终端的需求更加迫切。但是随着移动终端功能的不断增多、处理性能的
基于OCR的图文库检索方法有非常广泛的应用前景。将纸质文档以图像方式保存,但却利用文档图像的文字识别结果进行检索,这使得纸质文档的保存与检索都非常方便。但出于OCR的识别
定位是移动机器人研究中一项重要的内容,也是实现导航等其他功能的前提和保证。机器人视觉是智能机器人的一个重要分支,主要完成对外界环境的感知、描述、识别和理解,是产生行为
视频监控系统是集多媒体信息的综合、计算机的交互性、通信的分布性和监控的实时性等技术与一体的综合系统。并且随着信息化产业技术的高速发展,视频监控系统已逐步涵盖到多媒
计算机视觉研究的一个主要目的是从二维图像恢复三维物体的几何结构。为实现这一目的,通常需要图像匹配、摄像机标定和三维结构计算三个步骤,其中摄像机标定是不可或缺的一步,而
模仿和学习一直被认为是入脑智能的主要体现,让机器人模仿灵活的人体运动是人类的美好愿望,也是机器人智能的重要体现。基于标记点和运动捕捉系统的人体运动模仿系统已经比较成