基于改进的卷积神经网络的手势识别方法研究

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:yudalong880210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能、物联网、5G和云计算等新兴信息技术的蓬勃发展,人机交互(Human Computer Interaction,HCI)逐渐智能化、多样化。手势以其信息表达能力和传递功能强、简单易懂、非接触等特点,在机器人控制、虚拟现实(Virtual Reality,VR)、智能驾驶和手持云台等现实生活中得到了广泛的应用。然而,手势识别也存在一些如手势类别之间相似度高、手指之间存在自遮挡等问题,导致手势识别准确率不高。同时,基于卷积神经网络(Convolutional Neural Network,CNN)的手势识别算法参数量大,对计算机硬件要求较高,难以应用于资源有限的移动和嵌入式设备。因此,手势识别方法的研究具有重要的意义和实际应用价值。
  本文以卷积神经网络为理论依据,采用轻量型(Lightweight)的卷积神经网络模型,通过合理设计网络的结构和参数,在降低模型复杂度的同时,提高了手势识别的准确率。
  论文完成的主要研究工作与创新点如下:
  1、设计出了一种具有加权损失函数的双通道特征融合手势识别网络(WDN)
  针对目前手势识别存在的准确率不高和模型参数量大等问题,本文设计出了一种具有加权损失函数的双通道特征融合手势识别网络。首先,该网络是一种并行双通道结构,将两个并行的子网络学习到的手势图像局部特征进行融合,可以获得更丰富的手势特征信息。接着,为了平衡两个通道学习到的局部特征的权重,在训练过程中使用加权损失函数,有利于获得更好的手势识别准确率。然后,为了降低模型参数量,网络最后一层使用卷积层代替全连接层进行分类。实验结果表明,本文设计的加权损失函数的双通道特征融合手势识别网络有效提升了手势识别准确率,且模型参数量更少。
  2、提出了一种具有注意力机制和残差连接方式的双通道特征融合手势识别网络(ARDN)
  为了进一步提高手势识别的准确率并减少模型的参数量,将残差连接方式、注意力机制和深度可分离卷积技术引入双通道网络。首先,残差连接方式利用残差和图像分解知识,可以更为准确地学习手势特征信息。然后,引入注意力机制自动获取手势图像特征图中每个通道的重要性,并根据重要程度增强有用特征、抑制无用特征,从而实现了特征通道的自适应加权。最后,使用深度可分离卷积代替普通卷积可以大大减少模型的参数量。实验结果表明,本文提出的注意力机制和残差连接方式的双通道特征融合手势识别网络进一步提高了手势识别准确率,减少了模型的参数量。
  
其他文献
流量传感器作为测量流量的关键器件,在工业生产、航空航天、汽车电子和医疗健康等领域都发挥着至关重要的作用。流量传感器根据测量原理的不同可以分为多种类型,其中热式流量传感器因为结构简单、测量灵敏度高、功耗低、可以测量流体的质量流量等优势,受到了科研人员的广泛关注。随着MEMS工艺的不断成熟,以MEMS工艺为基础的热式流量传感器因为尺寸小、功耗低、精度高等优势逐渐应用到各行各业。本文设计并制作了一款基于
随着人工智能(Artificial Intelligence,AI)、云计算(Cloud Computing,CC)、大数据(Big Data,BD)和物联网(Internet of Things,IoT)等先进技术的发展,在软件定义网络(Software Defined Network,SDN)、机器学习(Machine Learning,ML)和深度学习(Deep Learning,DL)等多
随着光学传感的快速发展,光学传感器越来越受到人们的关注。在海洋探测、医疗健康、环境监测、工业生产、国防安全等领域具有很好的应用前景,对于传感信息的实时感知和监测具有很重要的意义。但光学传感器依然存在很多的局限性,如光源波长、环境温度等参数的漂移对传感结果的准确性有很大的影响。因此对这些参数的漂移进行补偿是很必要的。  本文基于非对称马赫曾德尔干涉仪(asymmetric Mach-Zehnder
过去十年间,非易失性存储市场呈现爆发式增长。NAND闪存存储器凭借良好的抗震性能,高集成密度,低廉的市场价格及出色的可靠性表现等诸多优势成为当今非易失性存储领域主流的存储媒介。二维平面(2D)NAND闪存存储器通过不断缩小器件物理尺寸来提高存储密度,然而2D NAND闪存器件尺寸缩小到一定节点时会造成不可控的可靠性隐患,存在技术壁垒。为了解决这个问题,三维立体堆叠(3D)NAND闪存存储架构被逐渐
脑机接口(Brain Computer Interface,BCI)技术是一种无需依赖大脑的正常信息传输路径,就能实现大脑与计算机、智能机械臂等外部设备直接连接的信息交流方式。在康复领域,BCI为神经通路遭到损伤的患者提供了与外界沟通交流的机会,在军事、人工智能、远程控制、游戏娱乐等领域,脑机接口也有重要应用。其中,对运动想象脑电信号(Motor Imagery Electroencephalog
学位
海洋信息的获取是认识海洋、利用海洋的重要途径,随着“海洋强国”战略的不断推进,我国在海洋信息监测方面的研究力度也不断加大。高频地波雷达能够对大面积海况实时监测,在洋流监测中得到广泛应用。海洋流场由表面流与深层流组成,利用高频雷达提取二维表面流,前人已经做了许多研究,由于电磁波在水中的衰减迅速,不能直接探测到深层洋流信息,如何基于雷达数据获取深层流信息的问题尚处于研究探索阶段。本文在前人研究的基础之
糖尿病是一种慢性疾病,其患者已经在全球范围内广泛分布。特别是近年来,糖尿病已经成为一种常见病,尤其是在低收入地区,由于医疗水平不足,糖尿病的发病率更是急剧增加。糖尿病的发生与生物体内葡萄糖的含量有关,无论是对糖尿病的控制还是预防,及时而且准确的检测体内的葡萄糖浓度都是至关重要的。因此,能够准确且高效地检测葡萄糖含量的低成本传感器已经成为当前研究的关键方向。现有的电化学葡萄糖传感器可分为两类,其一是
数字信息化的发展使得高速率数据传输逐渐占据了通信市场的主流。作为接收机的重要组成部分,时钟数据恢复电路凭借信号恢复质量高、电路功耗低、易于集成等优势,广泛应用在串行通信系统中。但随着数据速率的不断提高,在相同时间周期内所需处理的数据量成倍增加,这会导致数据信号的抖动性能衰退,进而使数据的传输质量受到影响。因此,低抖动型时钟数据恢复电路的设计对数据传输具有重要意义。本文针对时钟数据恢复电路的抖动性能
糖尿病是世界上最主要的慢性非传染性疾病之一。中国是糖尿病的重灾区,中国的糖尿病患者数量已高居全球首位。近年来,随着糖尿病患病率的上升,糖尿病带来的疾病负担越来越严重,糖尿病及其并发症严重影响了人类的生活质量。糖尿病性视网膜病变是糖尿病的严重并发症之一,增殖性视网膜病变甚至存在致盲风险。微动脉瘤是糖尿病性视网膜病变的最早期临床可见症状,在糖尿病性视网膜病变的初期筛查中起着重要作用。由于中国的糖尿病患
相干光通信集成了偏振复用技术、高阶调制技术、相干检测技术、数字信号处理技术,具有传输容量大、中继距离远、选择性好、灵敏度高、频谱效率高等优点,具有良好的应用场景。由于激光器发出的光信号包含不同的频率成分,不同频率成分的光信号经光纤传输后不能同时到达接收端而引起色散,色散不产生新的频率成分,属于线性损伤。光纤中存在线性损伤和非线性损伤,是制约相干光通信长距离、大容量、高速率发展的主要因素。线性和非线