基于属性的人物图像检索关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zj1280
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于属性的人物图像检索技术是图像检索领域中一个前沿的研究课题,在网络图像检索、个人相册管理和智能监控等领域有着良好的应用前景。传统的人物图像检索技术有基于文本和基于内容两种主要方式,但还不能完全满足某些实际应用的需求,如通过人物的表情、服装的颜色和款式等对人物图像进行检索。近年来研究者提出基于属性的人物图像检索技术,主要关注检索对象的面部属性。当检索属性涉及人体其他部位时,面临两个难点:一是人体部位的检测与分割问题,二是人物属性自动提取问题。  针对上述难点问题,本文对人体部位检测与分割和人物属性提取这两项关键技术展开深入研究,取得如下研究成果:  1.基于MSER分析的肤色检测方法  肤色信息是人物属性提取中一类重要的信息源。现有肤色检测方法未有效利用肤色区域信息,检测准确率不高。综合分析现有不同肤色检测方法的优缺点,本文提出一种基于最稳定极值区域(MSER)分析的肤色检测方法。首先通过面部颜色判断光照是否正常,得到稳定的、适应光照变化的肤色模型。然后引入纹理模型以有效排除类肤色背景。最后提出改进的MSER分析完成肤色区域的检测与分割。与八种现有方法的比较实验表明,所提出方法的性能优于现有方法,且可以有效应对光照条件的变化。  2.融合显著性分析与图割的姿势无关躯干分割方法  躯干分割是上身服装颜色等人物属性提取的基础,人体姿势的多样性给躯干的分割带来很大挑战,现有的躯干分割方法不能有效应对姿势的变化。本文提出一种融合视觉显著性分析与图割的躯干分割方法。首先基于非肤色视觉显著性分析实现与姿势无关躯干种子区域定位,然后基于超像素方法对种子区域进行有效矫正,最后通过图割模型对种子区域进行扩展得到躯干区域。实验结果表明,所提出方法能较好适应多种多样的人体姿势,与现有方法相比,在相同查全率下,查准率增幅达10%。  3.基于空间关系约束图割模型的人体分割方法  服装款式是人物属性检索的重要手段之一,对服装款式属性等的提取涉及人体上臂和前臂等灵活性较高的部位,目前分割准确率较低。本文提出一种基于空间关系约束图割模型的人体分割方法。首先利用人体结构的互补性构建人体部位概率图,该概率图可以有效表达像素点与人体外观的相似概率,由该概率图可获得较准确的人体种子区域。然后,利用人体弱结构性约束构建基于空间关系约束的图割模型,得到人体分割结果。由于引入人体自身的上下文信息——互补性和弱结构性约束,所提方法可以有效减低姿势估计不准确引起的误分割现象。在两个有挑战性的国际公开数据集上的实验验证了本文方法的有效性,对比试实验表明,本文方法比现有方法在F-metric评价标准下提高6%。  4.人物属性自动提取方法  属性的自动提取在基于属性的人物图像检索中至关重要,根据应用需求以及人体结构特点,本文提出了服装属性、表情属性、社会关系属性和构图属性等四类属性的提取方法,实验验证了提取方法的有效性。针对服装款式中重要的一类——正装,提出一种基于形状与统计特征的正装识别方法,该方法有效利用了正装领部的形状信息和正装中Harris角点分布的统计信息,实验表明,本文所提出的方法优于视觉关键词方法。  针对服装款式和纹理属性,提出一种通过分割结果得到自适应的人体部位权重的方法,实验结果表明,自适应人体部位权重的引入可以有效提高检索的准确率。
其他文献
近年来计算机体系结构的复杂化和计算平台的多样化,对程序优化产生了不容忽视的影响。通用编译器优化所得性能已经不能满足高性能计算的需求,开发人员越来越多地转向对程序和算
随着XBRL技术应用的不断深入,在商业活动中积累了基数可观的各类XBRL业务数据,其数量正以较大规模快速增长。同时,与这些XBRL数据在业务上相互关联的海量结构化数据也在不断的膨
学位
随着半导体工艺的进步,摩尔定律仍在延续,但Dennard缩放定律的失效使处理器设计面临功耗瓶颈,发射队列等关键部件因复杂度较高和线延迟增长而缺乏可扩展性,处理器单核的性能增长
目标检测是自动地从图像或者视频中发现并定位指定类别的目标,这项任务是计算机视觉和模式识别领域的研究热点。目标检测的研究不但对于计算机视觉、模式识别、图像处理等学科
基因测序已经成为获取基因序列信息的主要手段,是生命科学研究的前沿领域。自高通量技术测序出现以来,在测序通量大幅提升的同时,测序的成本在不断下降,目前为人类个体进行一次测
学位
近年来,随着集成电路生产工艺的进步,晶体管的特征尺寸不断缩小,使得单芯片能够集成的功能单元越来越多,产生了各式各样的复杂SOC芯片。这些SOC既需要具有较高的工作频率来完成复
得益于神经网络算法研究的进步,神经网络在许多场景下的精度表现优异,被广泛应用在图像识别、语音识别、自然语言理解、广告推荐乃至计算机围棋中。神经网络本身具有数据密集和
云计算和大数据的迅猛发展使得Java的应用更为广泛,同时也对Java的性能提出了更高的要求。传统Java虚拟机的设计已不能满足实际系统的需求。如何提高Java虚拟机的性能已成为现