基于中层特征表达的目标识别技术研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:lchf1129
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标识别作为计算机视觉中的核心问题以及智能视频监控中的关键技术,得到了广泛的关注和重视。该技术的目标是让计算机能够智能地识别出图像中出现的物体。具体而言,在智能视频监控系统中,目标识别技术就是理解并报告摄像头获取得到的图像及其图像序列中出现的感兴趣的人,并进一步给出其身份等信息。为了实现这些目标,典型的计算机视觉算法实现主要包括训练和测试两个阶段。训练阶段,给定图像中目标数据的特征表达后,通过分类器学习得到在特征空间划分样本分布的超平面。测试阶段,根据待测样本在特征空间中和超平面模型相对位置,实现对于样本类别的预测。这样,典型计算机视觉算法性能的好坏取决于数据特征表达是否有足够区分能力,分类器学习是否能够准确划分估计出样本的真实分布。随着智能视频监控系统获取得到的数据越来越多,精确但复杂的分类器模型已经不能适用,能否学习得到一个鲁棒且具有足够区分能力的特征表达逐渐成为解决现实条件下大规模图像数据分析的关键。本文针对视频监控背景下的目标识别技术中的中层特征表达学习这一问题展开深入而又广泛的研究,具体内容涉及目标分类、多摄像机跟踪、步态识别以及多模态行为生物特征融合等方面。在本文中,主要工作和贡献有:   ①针对当前无监督视觉词典的state-of-the-art方法,本文研究了图像目标分类中的快速编码过程以及有监督字典学习方法,在PASCAL VOC数据库上取得了一定的效果。   ②针对当前多视角步态识别中出现的鲁棒性问题,提出了一种基于低秩稀疏编码的视角变换模型,在CASIA多视角步态数据库的困难噪声数据上取得了当前最好的性能。   ③提出了一种基于L1-∞的群稀疏编码方法,在多视角步态识别以及多摄像机跟踪两个数据库上都取得了当前最好的性能。   ④针对行走中产生的地面反应力和步态姿势图像序列,提出了一种基于步态和足印的人体身份识别系统,并建立公开了一个大规模的算法评测数据库。基于这个数据库,提出了一种基于CCA的级联特征融合策略,在这个数据库上的实验表明了算法的有效性。   总的说来,本文对结合智能视频监控背景下的目标识别技术中中层特征表达问题进行了深入的研究,在构建中层特征表达上作了一定的探索。  
其他文献
视频技术已经成为安全监控的核心技术之一。在智能交通系统中,交通场景的监控对交通应急和交通信号控制起着重要作用。随着城市机动车辆的增多和城市化的迅速发展,交通事故日益
随着人类社会的不断进步,人们对移动机器人在未知环境下完成特定任务的需求越来越高。针对未知环境下移动机器人自主探索和地图创建问题,在机器人操作系统(Robot Operating Sys
作为家庭服务机器人的一种,智能轮椅在老年人及残障人士的生活中扮演着重要的角色。将机器人导航技术应用于智能轮椅上已经经过了多年的发展与研究,而如何准确地估计出机器人在
虚拟现实从提出此概念发展到现在,随着技术上的逐步成熟,目前已在航空、航天、铁路、建筑、土木、科学计算可视化、医疗、军事、教育等诸多领域得到了应用。但是,虚拟场景的
传统的叶片含水率诊断方法存在诊断方法繁琐且耗时长、分辨率不高、易受外界干扰、损伤叶片等缺点,本研究以一品红作为研究材料,通过粗糙集和模糊集的杂合,分析植物电特性与
随着市场竞争的加剧,企业内外部因素的不确定性逐渐增加,企业越来越意识到提前识别、评估和防范风险的重要性。战略风险作为企业风险中非常重要的一种,就更加受到企业管理者
信息物理系统(Cyber-Physical Systems,CPS)是在环境感知的基础上,融合计算、通信和控制能力的网络化嵌入式系统的集成。本文主要从CPS应用角度出发,提出将自主机器鱼作为CPS
作为计算机视觉领域的一个基本问题,物体分类吸引了越来越多的研究人员的兴趣。对物体分类技术的研究可以有效地推进图像理解的发展。同时,物体分类技术还可以广泛应用于其它领
无人机上电子设备的增加,减小了无人机可用空间。电池充电装置作为无人机设备的一部分,通过充电装置的高功率密度化,可以减少其所占用的空间。同时,电子设备的增加对电池的性能和
虚拟人脸动画技术是人机交互领域一个重要的研究方向。围绕人脸动画的生成方法以及人脸动画表达的逼真效果,在可视语音合成、可视韵律合成、人脸情感表达方面已经做出了很大一