基于视频的人群行为识别技术研究

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户：xuthusboy

【摘要】

：

【作者】

：

康小歌

【机构】

：

武汉科技大学

【出处】

：

武汉科技大学

【发表日期】

：

2021年01期

【关键词】

：

人群行为识别

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

有些发生概率较小的人群行为(例如踩踏，骚乱等)可能会造成巨大的财产和生命损失。现有群体视频数据集的平衡性较差，一般包括大量普通群体视频的样本，而某些发生概率较小的人群行为样本却很少。
　　人群行为识别是一种多标签分类任务，具有场景复杂，样本不均衡等特点。在现实场景中，即使是同一种人群的行为也可能具有不同的场景，外观噪声往往较大;同时，人群行为通常伴随着各种运动信息，从而导致相对较大的动态噪声。为了有效的描述视频中的运动信息，本研究选择将运动趋势特征与动态演变特征相结合的策略。由于样本分布的不均衡性，小样本类别在分类过程中不能达到令人满意的性能。因此，本研究提出利用属性之间的依赖关系为小样本类别构造子空间来解决小样本类别分类差的问题。主要包括以下三个方面的研究内容:(1)针对外观噪声和动态噪声导致分类差的问题，提出将带有类别信息的运动趋势特征同动态演变特征相融合;(2)针对不平衡样本和多标签任务的处理问题，提出了一种关联子空间的分类方法，使小样本类别与其它类别之间的关联信息更容易区分;(3)针对小样本类别的分类问题，本研究设计了子空间分类器，即通过弱化主要类别并加权类别之间的关联关系来优化当前子空间。
　　实验结果表明，本文所提算法性能在目前最大的人群行为识别的数据集(WWW数据库)上达到了主流的水平。该研究对智能视频监控技术的应用有重要的理论意义和广泛的应用前景。

其他文献

基于内容的图像检索系统

基于内容的图象检索在多媒体数据加和Internet网络资源的管理和利用中得到越来越多的重视,具有广泛的发展应用前景.该文主要研究了基于图像的底层特征(如颜色、纹理和形状)与相关性反馈来进行图像检索的方法,并且建立了一个实用的基于内容的Internet图像检索系统以及一个一放式的实验平台.我们采用不同的颜色空间和颜色特征,实现了多种基于颜色的图像检索算法,并且在我们建立的彩色图像数据库上对这些算地进

学位

图像检索

公路设计中纵断面优化设计算法的研究

在公路设计中,公路纵断面的自动优化设计一直是公路设计人员研究的课题.该文针对初始纵断面的自动形成(自动定坡)和公路纵断面的优化设计作了详细的讨论.该文的自动定坡方法是在三角形高程加权和最小二乘法的数理理论基础上形成的.文中介绍了纵断面优化设计中常用的一些传统算法,讨论了纵断面优化问题数学模型的建立方法,并重点介绍了动态规划法.动态规划法因其算法简单易行且优化精度高而一直受到工程设计人员的青睐.根据

学位

公路纵断面

基于自注意力和问题分解的机器阅读理解方法研究

机器阅读理解是自然语言处理领域的一颗明珠，同时也是该领域的研究焦点。机器阅读理解技术可以广泛应用于语音助手、智能客服、聊天机器人等领域。近年来，得益于大数据和深度学习技术的兴起，机器阅读理解获得了广泛的关注。在传统的工作中，主要采用基于规则和基于深度学习的方法。其中，基于深度学习的方法对问题和上下文分别进行编码得到向量表示，然后利用注意力机制使得两者进行交互，最后利用交互的语义信息预测答案的开始和

学位

机器阅读理解

基于沙漏模块的对象检测及其在Arm上的部署

目标检测是计算机视觉领域的重要方向，随着深度学习方法及相关硬件设备的发展，它在自动驾驶、智能监控、智能手机等方面都有着广泛的应用，具有重要的研究意义。　　基于无锚框深度学习的目标检测是一种主流的单阶段目标检测算法。融合多层监督信息的沙漏网络结构能够显著提升无锚框目标检测算法的精度，然而其速度却远低于同层次的普通网络的速度，并且不同尺度目标间的特征会互相干扰。针对上述问题，本文提出了一种非对称沙漏网

学位

深度学习

基于卷积神经网络的胎儿头围测量方法研究

测量胎儿头围可估计胎龄和监测胎儿的生长。医学超声影像技术由于其廉价性、无辐射和实时性，成为测量胎儿头围的首选方式。然而，目前的主要测量方式是通过有经验的医师手动测量，测量精度依赖于医师临床经验。这种方式易导致超声图像测量耗时，增大医师工作量。现有有经验的医师资源并不充足，一些落后地区更为明显，影响孕妇产前检查的准确性。为了提高超声测量的工作效率以及准确性，本文提出一种测量方案帮助解决自动测量胎儿头

学位

医学超声图像

基于密集3D部件对齐的行人重识别方法研究

行人重识别是指在跨摄像头的场景下进行行人的匹配。它是计算机视觉中的热门研究领域之一。在实际应用场景中，摄像机拍摄角度的变化、身体部件被拍摄场景中物体遮挡以及行人姿态存在多变性等问题使得行人在检测框内的空间上不对齐，这给行人重识别的特征提取阶段带来了极大的挑战性。因此，如何在跨视角场景下获取具有高判别力的特征是行人重识别的研究重点。针对以上问题，本文提出了基于密集3D部件对齐的行人重识别方法研究。具

学位

行人重识别

求解多模态优化问题的烟花算法的研究

在大量实际问题中，往往存在不止一个全局最优解和多个局部极值解，如何构造一种优化算法，使之能够求出所有全局最优解和尽可能多的局部最优解，这类问题就称作多模态优化问题或多峰函数优化问题。而多模态优化问题又可以分为多模态单目标优化问题和多模态多目标优化问题。烟花算法是最近才提出一种群体智能算法，可以用来求解很多实际的优化问题，具有很好的局部搜索能力。但是近年来烟花算法还没有被应用到求解多模态优化问题上。

学位

群智能优化算法

基于流形子空间学习的领域自适应方法研究

传统机器学习方法只有在训练数据和测试数据满足相同分布时表现出良好的效果。在现实场景中，训练数据往往与测试数据分布不同，从而导致分类准确率降低。　　在领域自适应问题中，将训练数据作为源域;而将测试数据作为目标域。其目的是减少源域和目标域之间的分布差异。本文提出两种基于流形子空间学习的领域自适应方法，用流形学习的方法将源域和目标域映射到同一子空间中去。在这个子空间中，源域数据和且标域数据有着相似的分布

学位

领域自适应

多模态特征融合的Kinect动态手势识别技术研究

手势识别技术作为人机交互领域内的关键技术之一，因其便捷、自然的交互方式有着广阔的应用前景，也因此成为各国学者的研究热点。传统手势识别技术通常借助外部穿戴设备，限制了用户活动自由，逐渐被基于计算机视觉的手势识别技术取代。而基于计算机视觉的手势识别方法易受光照变化、环境背景的影响，有一定的局限性。深度采集设备Kinect的出现为这一缺陷提供了解决方案。因此，本文基于Kinect设备采集的深度图像与彩色

学位

手势识别

基于语义判别哈希的跨模态检索研究

网络技术的发展以及信息的快速流动导致多媒体数据急剧增长，呈现出规模变大、类型增多的特点。在这种情况下，传统的单模态数据检索再难满足用户对多种类型数据的检索需求，同时大规模的多媒体数据对检索提出了新的挑战。利用哈希码低存储、高效率检索的特点，跨模态哈希检索在众多的检索方法中得到了研究者们越来越多的关注。　　跨模态哈希检索的关键问题是如何利用异构数据中的潜在关联缩短语义鸿沟。大多数的方法忽略了以交互方

学位

跨模态检索

基于视频的人群行为识别技术研究

其他学术论文