面向室内场景的人头检测算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：abo000

【摘要】

：

【作者】

：

彭云

【机构】

：

哈尔滨工业大学

【出处】

：

哈尔滨工业大学

【发表日期】

：

2019年12期

【关键词】

：

室内场景

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来，人脸检测和行人检测是计算机视觉中非常重要的研究课题，并且取得了相当大的进展。然而，基于二者的人数统计任务在实际应用中仍存在限制。人脸检测方法仅仅能够检测人脸，这就意味着当人背对着摄像头时，该目标就会漏检；同时由于室内场景的复杂性，身体的大多数部位都是不可见的，所以行人检测的方法同样不可行。而人头检测就没有上述限制。在人头检测领域，虽然已经有相关团队基于传统图像处理方法及深度学习方法对其进行研究，但由于人头目标具有尺度小、拥挤场景下极度密集等检测难点，因此仍然有较大的提升空间。此外，如何平衡检测模型的精度和速度也是一大难题。
　　本文主要基于卷积神经网络，提出能够准确且高效地进行人头检测的新网络。网络主要由基于空洞卷积的Anchor预生成模块、基于反卷积的层间特征融合模块以及基于语义上下文信息的人头检测模块三部分组成。Anchor预生成模块的主要作用是过滤易分类的负样本，解决目标检测中的正负样本不平衡问题，得到精炼后的Anchor目标。特征融合模块主要对不同尺度特征层进行融合，通过融合高分辨率、弱语义信息、多位置信息的低层特征，以及低分辨率、强语义信息、少位置信息的高层特征，使得特征在语义表达能力增强的同时位置信息也能够增强，针对性解决小目标漏检问题。人头检测模块以精炼后的Anchor目标以及融合后的特征作为输入，通过增大有效感受野的方法，充分利用语义上下文信息辅助检测人头目标，有效改善因干扰物体造成的目标漏检问题，最后进行二次级联的分类回归，得到准确的人头目标位置。
　　本文设计了新的人头检测网络结构，通过Anchor预生成模块、特征融合模块及人头检测模块三部分共同作用，最终模型能够在检测精度和速度上达到平衡。同时网络利用不同尺度特征层的输出，将各相邻特征层通过“自顶向下”以及“横向连接”的方式，进行特征融合解决小目标漏检问题。此外，提出线性非极大值抑制，以减轻因目标相互遮挡现象造成的人头目标漏检问题。最终本文在公开的人头数据集Brainwash上，通过进行实验对比以及验证各个模块的作用，模型检测精度达到了当前最优的结果，平均精度值为90.40%，同时检测速度能够达到25帧每秒。

其他文献

基于激光雷达的SLAM方法研究与实现

近年来，随着人工智能成为各领域的热点研究方向，作为人工智能典型代表的机器人新研究也进入新的热潮。对于智能机器人而言，能否自主地对环境进行辨识以及自主定位是其智能化的重要基础与标志，因此移动机器人的同时定位和地图构建(SLAM，Simultaneous Localization and Mapping)是一项重要课题。　　本文将激光SLAM的研究与实现分为2D激光SLAM和3D激光SLAM两部分，主

学位

激光SLAM

差动变压器式位移传感器系统的研究

当今信息技术的发展离不开传感器，然而传统传感器的精度不高，抗干扰性能差。传统传感器与计算机技术相结合，研制出智能传感器测量系统，从而达到提高传感器的精度和抗干扰性能的目的。　　本文首先介绍了差动变压器式位移传感器的工作原理以及温度传感器的工作原理，针对温度与位移两个物理量进行了二维标定实验，得到了不同温度下该传感器的输入输出数据，从该数据知道温度会影响该传感器的测量精度，必须要对其采取温度补偿的措

学位

差动变压器式位移传

SDN网络数据流测量关键技术研究

数据流测量是网络性能管理的重要研究分支之一，可以为各类网络管理应用提供实时、基础的测量数据，比如流量工程、异常流量检测及流量行为分析等，从而确保这些管理应用的可靠运行。随着信息技术的快速发展与更新，无论是网络环境，还是网络技术都在日新月异地发生着变化，比如应用服务日益繁荣，导致网络流量急剧增加；网络环境不断演进并逐步延伸至物联网；SDN技术将控制与数据平面解耦，极大提高了网络管理的效率等，这些变化

学位

软件定义网络

虚拟三维服装展示关键技术研究

与物理试穿不同，虚拟试穿系统允许购物者在购买服装之前虚拟可视化服装试穿效果。目前的虚拟试衣系统在仿真环境交互、款式设计、自动裁剪以及服装模拟方面达到较好效果，但在虚拟服装拟合评估、服装图案自适应调整、真实感细小折皱生成、虚拟角色服装效果展示以及服装变形效果展现的虚拟三维服装展示关键技术方面还存在着较多缺陷，这也成为了三维虚拟试衣系统推广应用的瓶颈。本文针对虚拟三维服装展示关键技术展开研究，取得了以

学位

虚拟试衣

基于群智能的矿山排水系统调度优化方法研究

本文针对矿山排水系统中的水泵机组调度问题，以水泵机组所耗电费最小、水泵负载均衡为目标，以分时电价为基础，建立了相应的约束优化模型，进而结合水泵调度问题的特点，提出了基于群智能优化算法的调度算法。本文的主要创新点包括：　　（1）给出了矿山排水系统中水仓水位预测算法。矿山排水系统启停的主要约束是水仓水位不能超过预定的阈值，对水仓水位进行预测是实现优化调度的基础，其关键是对涌水量进行预测。为此，提出了基

学位

矿山排水系统

云计算中虚拟机部署算法研究

云计算使得用户可以通过互联网来使用应用程序、计算、服务和存储。通常情况下，为确保计算效率以及智能手机的能源效率需要使用很多软件和硬件。近年来，随着科技不断进步，已经引入了许多新技术来最大限度地利用资源并降低成本。在数据中心中，云计算可以托管多种类型的异构虚拟机VM，并提供灵活性、安全性、支持以及比传统数据中心更好的维护等。在云计算中，需要解决　　在云计算中需要考虑能源使用优化、资源利用、减少时间消

学位

云计算

云端融合环境下计算迁移机制研究

云端融合计算是大数据发展的产物，是当前主流的一种计算范型，它是多种计算形态的结合，其发展经历了两个阶段，形成两种不同的架构：移动计算和云计算融合的云／端融合架构；边缘计算出现之后，终端、边缘节点、云计算中心三者结合的云边端融合架构。在云端融合中，计算迁移(Computation Offloading)是一种重要的计算模式，即终端设备通过向远程具有较强计算能力的设施（边缘节点或者云服务器）迁移部分计

学位

云计算

基于分段算法的医学图像的模糊聚类阈值研究

医学图像分割在临床研究中有非常重要的应用，可用于治疗可视化及手术计划等应用。虽然已经有大量人脑组织图像分割的相关研究，但是，已有的分割技术要么太复杂，要么对某些应用来说不够准确。为此，本文提出了三种新的医学图像分割算法。　　首先，利用模糊水平集方法的中值滤波器来提出磁共振成像（MRI）脑组织图像的模糊分割。MRI图像用作输入图像，利用中值滤波器和模糊C均值（FCM）聚类来分别去除图像噪声并创建图像

学位

医学图像

基于统计方法的人脸识别增强图像相似性度量研究

图像的相似性或失真性评估对图像处理和计算机视觉的广泛应用至关重要。已经提出了很多基于统计学的图像相似度量方法来处理特定类型的图像失真，如具有广泛应用的经典结构相似度度量技术SSIM。　　由于涉及诸如头部姿势、不同类型的光照和不同面部表情之类的重大挑战，人脸识别被认为是图像相似性研究中最艰巨的挑战之一。提出了四种新的用于人脸识别的图像相似性度量方法，进而来完成人脸相似性检测和人脸识别，并对提出方法进

学位

人脸识别

人脸识别中基于信息论方法的增强图像相似度测量研究

图像相似性评估和人脸识别评估在图像处理和机器视觉领域具有广泛的应用，研究者已经提出了许多测量方法来应对图像相似性和人脸识别评估技术所面临的挑战。　　本文着重从统计学和信息论两个方面研究图像识别的相似性。研究表明信息论方法和统计方法在图像识别中具有较好的性能，但混合方法在相似性判断上具有更好的效果。利用功能和通用规则对面部和非面部图像相似性评估进行了深入研究，特别研究了它们的性质及其对相似性和判别的

学位

人脸识别

面向室内场景的人头检测算法研究

其他学术论文