基于1范数最小化学习的人体检测算法研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:mn012love
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体检测是计算机视觉与模式识别领域中的研究热点,具有较强的理论意义及较大的应用价值,受到国内外研究人员的广泛关注。图像传感器捕捉到的人体目标具有一定的姿态与视角变化,在噪杂背景中呈现复杂的模式,这使得人体检测成为目标检测方向中的一个难题。   要使计算机能够自动地识别或检测人体目标,需要赋予它透过图像内容的变化区分人体目标的本质特征与非本质特征的能力。本文首先提出一种基于1范数最小化学习(Ll-norm minimization learning,LML)的优化模型,然后在此基础上提出一种线性分类算法(Linear LML,L-LML)。该算法利用1范数的稀疏性,从VC维最小化的角度构建线性分类器同时实现特征选择。在分类器构建过程中,L-LML算法通过对分类器的法向量建立1范数最小化约束模型,然后根据训练样本的特征分布计算分类器的阈值,从而完成线性分类器的学习。由于法向量的稀疏性,对特征向量实施法向量加权,突出了特征向量各元素之间的差异性,实现了特征向量的稀疏表示,达到了特征选择的目的。   考虑到样本分布的复杂性及非线性可分等特点,本文在LML优化模型的基础上,提出了一种基于1范数最小化学习的非线性学习算法(Non-linear LML,NL-LML)。该算法首先对样本实施一种由核函数诱导的非线性变换,将样本映射到高维空间,并对样本重新进行表示,然后利用LML模型对变换样本进行训练。这种由核函数诱导的非线性变化简单有效,与LML优化模型结合可以实现非线性分类。NL-LML也可以实现特征的稀疏表示。不过与上述L-LML不同,此过程是在变换特征空间而非原空间进行的。   为实现图像块状特征的选择及提高目标检测效率,本文基于LML优化模型设计了一种级联分类器(Cascaded LML,CLML)。该分类器中的每一级为多个弱分类器加权投票组合构成的强分类器。每一个弱分类器对应一个图像块状特征,对弱分类器的选择即是对特征块的选择。弱分类器的法向量和阈值分别通过LML优化模型和min-max罚函数模型训练得到。在强分类器的构建过程中,本文提出使用整数规划模型,从全局最优化的角度确定有投票权的弱分类器,从而实现弱分类器的最优组合方式。   本文使用梯度方向直方图特征(HOG)及变尺度梯度方向直方图特征(v-HOG)表示人体目标,所提到的所有算法均在公开的人体测试集INRIA与SDL上进行了验证。
其他文献
随着互联网用户及应用的快速增长,基于Web的网络版系统备受关注,而工资管理系统作为各企事业单位信息化中必不可少的部分,特别是对于机关事业单位的工资需要有国家政策作为指导,
图像理解是在图像处理与分析的基础上,结合人工智能和模式识别理论,解释客观图像场景并分析图像内容,从而指导和规划人类行为。图像理解以图像为对象,知识为核心,研究图像中何位置
随着多媒体技术以及计算机互联网技术的迅速发展,人们生活中触手可及的图像数据呈现爆发式的增长趋势,这对机器自动分析和识别图像内容的技术提出了迫切的需求和挑战。一方面,受
模式识别技术的日趋成熟,在现代计算智能领域,显现了其广阔的应用前景。目前,诸如人脸识别、指纹识别等技术已被成功运用于商业开发。但随着信息量的不断增大和对识别精度要
面对海量的数据增长,资源有限的企业和用户如何有效维护大量存储设备并实现数据的有效存储和管理成为一个亟待解决的问题。随着P2P技术的发展,P2P存储技术成为该问题一种新的
网络态势感知系统是未来网络安全管理系统发展方向,开展对网络态势感知系统的研究具有重要的理论与现实意义。   本文以建立一个基于数据仓库的网络安全态势感知系统为目
随着RFID技术的不断进步与发展,促进了其在不同领域的广泛应用,尤其在农业领域,具有巨大的需求潜力,研究与开发面向农业领域专用的新型RFID读写器对农产品安全溯源系统构建和农产
在人们的日常生活中,人脸表情是一种重要的交流方式,能够直观明了地表达主人公的喜怒哀乐等思想感情。近年来,随着计算机软硬件技术的迅速发展,将多媒体技术带入了一个全盛的发展
为了堵塞税收漏洞,加强税源监控和税务管理,2004年4月,国家税务总局等部门联合发文,决定在适用的行业推行税控收款机。然而,将普通收款机替换为税控收款机,往往会会影响很多
域名系统(DNS)是因特网的一项核心服务,它作为可以将域名和IP地址相互映射的一个分布式数据库,能够使人们更方便的访问互联网。然而DNS协议本身在设计时并没有充分的考虑到其