基于深度学习的手势分割和识别方法研究

来源 :长安大学 | 被引量 : 0次 | 上传用户:flfi2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,人机交互成为人们日常生活中的一个重要组成部分。在智能家居、医疗教育、虚拟现实等方面得到广泛的应用。由于手势具有自然、直接等优势,手势交互已经成为人机交互领域的一大研究热点。因为受到光照、复杂背景及手型变化等因素影响,手势分割和手势识别依然是手势交互的主要研究内容。近年来,深度学习在计算机视觉的巨大成功给手势交互带来了新的研究思路和方法。本文对基于视觉的手势交互进行了较为深入的研究,提出了一种新的基于深度学习的手势分割和识别算法,实现了准确、快速的手势识别。本文主要工作包括以下几个方面:1.针对复杂场景下的手势分割,将全卷积网络(Fully Convolutional Networks,FCN)引入手势分割领域,并构建了基于VGG-16的FCN分割模型。首先将VGG-16的全连接层替换为卷积层,并增加上采样层,然后使用跳跃结构来提取细节信息,最后在OUHANDS数据集上对该算法进行验证。实验结果表明,本文提出的FCN分割模型对光照、复杂背景及面部遮挡具有良好的鲁棒性。2.针对FCN分割算法存在的边缘细节丢失、分割速度慢等问题,提出了一种基于全卷积残差网络(Fully Convolutional Residual Network,本文简称FCR-Net)的手势分割算法。借鉴FCN去掉全连接层的思想,算法将ResNet作为基础网络,并加入空洞空间金字塔池化模块实现融合上下文和多尺度信息的手势分割。在OUHANDS数据集上对该算法进行验证,实验结果表明,该算法在保证分割速度的同时,更好的保留了手势细节信息,将平均准确率提高到了91.45%。3.通过对各分类网络进行简要分析,搭建了用于手势识别的深度卷积神经网络(Deep Convolutional Neural Network,DCNN)模型,该模型具有参数少,计算量小的特点。为了提升手势识别性能,在模型中加入了批归一化层和全局均值池化层。使用本文手势分割图片对该模型进行验证,实验结果表明,本文的手势识别算法识别精度高、识别速度快,为实现实时的手势识别提供了一种较好的策略。
其他文献
目的探索宫颈上皮内瘤样病变(CIN)后人乳头状瘤病毒(HPV)16、18持续感染的环形电切除术(LEEP)治疗方法,以提高临床治疗效果。方法对195例因宫颈上皮内瘤样病变进行初次LEEP术
研究了防裂剂、减水剂、碳化硅、石墨和钢纤维等加入量与材料性能之间的关系。通过孔隙率、抗弯强度、抗压强度、冷热循环次数、耐渣铁腐蚀等性能 ,以及组织结构等的测试分析
热固性不饱和聚酯玻璃纤维增强模塑料(DMC)制件主要存在加工效率低、后处理成本高的工艺难题,分析了DMC压塑成型、注塑成型、传递成型的工艺方案特点,给出了断路器中DMC制件的
近年来,随着我国小微企业蓬勃发展与国家政策倾斜,地方性商业银行加强了对小微企业融资的创新研究,但是限制条件较多的信贷产品仍然难以满足小微企业的融资需求。本文在研究
较化学检测法等传统环境污染检测方法,光学测量方法以其无可比拟的优势广泛应用于环境污染物的检测及监测,近几十年来发展迅速,并具有广泛的应用前景.随着激光技术和计算机技
<正>物联网是新一代信息技术的高度集成和综合运用。近年来,我国物联网发展成就显著,成为全球物联网发展最活跃的地区之一。伴随着物联网快速发展的同时,与之俱来的是日益凸
目的研究综合护理干预对脑血管病患者颅脑术后消化道应激性溃疡(SU)出血的效果。方法选择收治的接受颅脑手术治疗脑血管疾病患者104例,按照入院顺序分为对照组与研究组各52例。
随着生活水平的不断提高,空气污染问题也越来越凸现出来,据世界卫生组织公布的《2002年世界卫生报告》指出,室内烟尘与高血压、胆固醇过高症及肥胖症等被共同列为人类健康的1
小学语文大纲指出:朗读和默读是阅读教学中最经常最重要的训练,各所级都要重视朗读,充分发挥朗读对理解课文内容,发展语言,陶冶情感的作用。  我们必须转变观念,从应试教学转变过来,把教学立足点转移到以读为主的教学实践上来。将朗读训练贯穿于阅读教学始终,落实到每个环节,做到学前读,学中读,学后读。  学前读。指初读课文,表层性朗读。讲课前,先让学生默读(低年级应朗读)。这时,应由学生自由读,多读几遍,克
随着国民经济的增长,我国幼儿食品包装对色彩元素的应用有了很大的提高。本文将通过分析色彩元素与幼儿消费心理的关系,阐述色彩元素在儿童食品包装中的重要作用,并对儿童食