基于随机森林和TLD的手势跟踪系统的研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:chc1102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着时代的变迁和技术的进步,人们已不满足于用键盘和鼠标对计算机进行操作,因此人机交互技术就成为了当下的研究热门,而手势交互就是其中最受关注的一个方向。手是人体最为灵活的部位,手势所能够表现出来的是复杂的,多变的,丰富的语言含义。然而现有的手势交互多基于简单的预定义动作,可交互的语义数量和功能很受限制,而且需要按规则记忆,交互体验并不理想。如何找到一种更接近本能的自然交互方式,如何克服手的复杂多变,如何处理环境中的种种干扰,准确的定位出目标手势所在位置并获得一系列连续的跟踪轨迹,这是一个十分具有挑战性的课题,值得不断的深入研究。针对此,本文提出在单目第一视角下以裸手在空中书写文字方式来传递信息的新型交互手段。对单目视觉第一视角下复杂环境中的书写手势检测与跟踪问题进行研究,这两者是实现手势交互的前提和基础。  手势检测为手势的第一帧自检测。为了能够在复杂环境下具有较高的鲁棒性和准确率,本文采用基于2bitBp特征的随机森林分类器进行手势检测,检测目标为书写手姿态,如果检测到多个目标则进一步结合验证算法辅助判断,最后得到一个满意的用户手势位置。实验结果表明该方法能够在各种复杂背景下准确地找到目标手势的位置。  手势跟踪在手势检测得到位置的基础上,采用TLD框架进行跟踪。TLD算法的跟踪鲁棒性高,结合PN在线学习方法,可进一步提高检测准确率,对于长时间手跟踪和一定程度的手部形变有良好的适应性。本文分析和实现了原始的TLD跟踪算法的各个模块,同时结合线下检测器构成了能够实现全自动书写手势跟踪的系统。方案使用基于前向后向误差法的Median flow算法来作为TLD算法框架的跟踪模块,而将原TLD算法的检测模块实现为改进后的检测器和验证器两部分的组合。  文中最后对本文所搭建的系统进行了试验验证,逐一测试了检测器、验证器和跟踪器的功能。试验结果表明本文设计的算法检测准确率高,跟踪稳定,不易受到复杂背景的干扰,可以在第一视角的书写手势交互系统中得到实际应用。
其他文献
该文简要地介绍了目前流行的CIM体系结构和参考模型,分析了这些体系结构和参考模型的特点,并以此提出CIM环境下的销售管理子系统的体系结构.根据天津钢管公司销售部门的具体
该文研究了浮动汇率制度下汇率的决定和预报问题.这顶研究不仅为未来预测新汇率制度下人民币汇率的走势奠定了基础,而且对目前涉外部门预测外汇汇率的走势有一定的参考价值.
初始对准在很大程度上决定了系统的工作精度和快速反应能力,是惯性导航系统的一项关键技术。静态情况下,一般采用传统的对准方案实现惯导系统的初始对准,即利用加速度计和陀螺仪
该文首次在中国提出了用遗传算法解决火电机组精确模型的经济调度问题,并对遗传算法应用于火电机组经济调度问题做了深入的研究,提出了用N-1法选取初始变量构成遗传算法的初
月面巡视器在执行月面巡视勘察任务过程中是处于未知的、非结构化的环境中,需要通过视觉系统感知周围地形环境,建立地图模型,并据此进行路径规划完成障碍物规避,确保巡视勘察过程
学位
学位
学位
学位
学位