基于深度学习的手势识别研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:listen342325
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手势识别在人机交互、聋哑人教学、虚拟现实、智能家居等领域中有着重要的应用前景。目前根据获取手势数据的方法不同,可以将其分为两个不同的方向,一是基于数据手套的,另一个是基于视觉的,基于视觉的手势识别又可以分为基于带颜色手套和基于徒手的研究。其中,基于徒手的自然手势识别由于其自然性和便捷性逐渐成为了一个热点研究问题,但是受非特定人、光照、及姿态变换等因素影响,手势识别仍然是一个具有挑战性的问题。手势识别的一个关键问题是手势特征的表示与提取,目前的手势特征表示大多是基于人工定义的特征,通常需要相当多的先验知识和大量的人工调整。近年来,随着基于学习的特征提取方法性能的不断提升,深度学习方法逐渐受到众多学者的关注,进而成为目前最流行的基于学习的特征表示方法。  本文针对鲁棒的手势特征时空表示问题,融合了深度学习方法和预定义特征,通过两者互补表达动态手势的特征。具体地,结合深度学习方法中的卷积神经网络(Convolutional Neural Networks,CNN)模型对自然图像优秀的表示能力和方向直方图特征的方向特征表达优势,进行对手势特征有效表达;然后,鉴于隐马尔可夫模型(Hidden Markov Model,HMM)在手势识别领域的成功,引入HMM进行时序手势动作分类。从而提出了一种基于CNN-HOG-HMM混合模型的动态手势识别研究方法,本文主要的研究成果如下:  (1)基于CNN的静态手势识别研究。鉴于CNN在自然图片识别分类中的优异性能,针对静态手势特征表达的特点,重点研究了CNN的结构和参数设置,从理论和实验上确定了面向静态手势表示的CNN架构以及相关参数设置,在两个静态手势数据库上均取得了优异的识别率。  (2)基于CNN-HOG-HMM的动态手势识别。利用CNN提取的静态手势特征具有一定的旋转不变性特点,而在动态手势表达中,同一个手形不同的运动方向表示不同的含义,为此,在动态手势序列的每一帧的表达中,除了手势的手形,还要表达其相对上下文的运动信息。因此,本文在基于CNN自动提取手势特征的基础上,融合了对旋转敏感的HOG特征,用CNN-HOG混合特征进行动态手势的帧级手势特征表达。分类阶段,引入对动态时序序列具有很好分类性能的HMM模型。这里,由于不同手势的时长不同,本文研究了自适应状态数的HMM模型。  (3)本文在自己采集的数字手势库和剑桥手势库上进行了静态手势识别实验,基于CNN模型的静态手势识别方法在两个库上分别取得了98.2%和94.1%的平均识别率。在剑桥动态手势库上进行了动态手势识别实验,基于CNN-HOG-HMM混合模型进行动态手势识别研究,取得了92.3%的平均识别率。实验证明了本文提出模型对于静态和动态手势识别的可行性和优越性。
其他文献
第三代合作伙伴计划(3rd Generation Partner Project,3GPP)考虑到未来用户对多媒体业务的迫切需求,因此引入了基于SIP协议的IMS (IP Multimedia Subsystem,IP多媒体子系统)
随着Internet技术的迅速发展,在线新闻己成为人们获取信息的主要途径。然而互联网上的新闻杂乱无序、增长迅速,人们很难从如此庞大的信息库掌握有用的信息,特别是最新的消息
高效视频编码HEVC(High Efficiency Video Coding),又称H.265,是由JCT-VC(Joint Collaborative Team on Video Coding)在2013年1月推出的新一代国际视频编码标准。在与现有标准
虚拟机池化管理是指以统一管理视角提供虚拟机生命周期管理和资源按需提供的虚拟化技术。近几年来,虚拟机池化管理已成为构建主流云计算平台的关键技术之一。根据IDC报告,预计
随着信息技术的发展,机器学习已经成为人工智能领域的一大研究热点。机器学习包括统计机器学习和集成机器学习,自弱学习定理证明以来,通过弱分类器集成得到强分类器这种集成机器
继个人计算机、互联网时代之后,云计算被看作第三次IT浪潮。云计算是一种IT资源的交付和使用模式,用户通过网络按需使用所需硬件、系统、软件以及服务等资源。云计算具有超大
随着网络技术的飞速发展,信息感知和网络应用产生了巨大体量的数据,大数据时代已经来临。目前,网络大数据中绝大部分是无标签的数据,如何挖掘隐藏在大数据中的有价值信息,获
学位
人体姿态估计是对图像中人体特征点位置的检测,目前已经成为计算机视觉领域的重要研究方向之一,且应用十分广泛。人体姿态估计的研究奠定了人体运动分析、人机交互、模式识别和
随着集成电路制造工艺的迅速发展与应用需求的不断提高,多核处理器是目前微处理器发展的主流方向。在基于共享存储的多核处理器系统中,当多个处理器核对同一存储位置访问时,