论文部分内容阅读
随着计算机视觉和人工智能技术的高速发展,以机器为中心的交互方式正逐渐被以人为中心的交互方式所取代,社会迫切需要更人性化、智能化的交互方式,由于手势交互具有直观性、方便性和自然性等特点使其成为一种重要的交互方式。目前手势交互还处于初级水平,研究基于计算机视觉的静态手势识别具有非常重要的意义。本文以提高手势识别准确率和识别速度为研究目标,设计实现一个基于计算机视觉的静态手势识别系统,完成对预定义静态手势的识别,该系统主要包括手势图像预处理、手势图像特征提取与分类识别三个部分,本文重点研究特征提取和分类识别。 首先探讨了经典的特征提取算法、降维算法和分类算法,详细介绍了HOG算法、LBP算法、PCA算法和SVM算法的原理和实现步骤,实验对比了各个算法的优缺点,使用单一的经典算法提取到的特征具有较高维度且特征中不包含手势图像的类别信息影响了分类速度和准确率,针对这一问题,本文提出一种改善方法,引入稀疏自编码网络(SAE)对多种特征进行降维融合,经过降维融合后的特征不仅具有较低的维度同时克服了单一特征表达能力不足的局限性,SAE是一种无监督深度学习网络需要大量的数据进行学习训练,为了克服训练数据较少的问题本文在原有数据集基础上进行扩充,扩充方法有旋转、对称和平移,通过JTD手势数据库上的实验证明,使用新特征可以有效提高系统性能。 其次深入研究了SVM分类器与特征的关系,使用SAE算法提取到的特征缺少手势图像自身信息,导致出现同类别样本错分现象,针对这一问题,本文提出一种基于SVM的集成分类器算法,额外增加两个不同分类器KNN和XGBoost,使用粒子群优化算法从中选出多样性与精度较高的集成参数构建集成分类器对特征进行识别,通过JTD手势数据库的实验表明,本文所提出的方法取得了96.67%的分类准确率,且相比于单一分类器精度提升了2.53%。 最后设计并实现了基于Microsoft Visual Studio2015和OpenCV环境下的SAE-(HOG+LBP)-SVMs静态手势识别系统,系统主要包括图像预处理模块、SAE训练模块和分类器模块,将JTD数据集进行扩充制作成训练集,在正常光照环境下采集手势图像制作成测试集,通过JTD测试集和自制测试集上的实验证明,该系统相较于经典识别系统具有更高的准确率和更快的识别速度,改进后的算法具有可行性。