基于Kinect传感器姿态采集PPT控制系统软件设计

来源 :企业文化·中旬刊 | 被引量 : 0次 | 上传用户:liuyongqiang615
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:设计一款可以通过人体动作对PPT进行简单播放、翻页、停止等简单操作的控制系统。该系统主要有外设和pc机组成。通过Kinect体感传感器采集人体姿势信息,在pc机中进行预处理、判断是否符合触发条件,在执行相应的操作。总而言之,本论文就是主要围绕姿势识别展开,通过kincet传感器姿态采集系统,然后对姿势进行识别最终实现对控制。
  关键词:人机交互;Kinect传感器;姿态识别;PPT控制系统
  随着人机交互在人们生活中的发展,大家越来越提出智能化,实现正真的人机交互。我们致力于研究出,一种全新的操控方式,基于kinect的姿势控制。通过人的姿态来控制PPT,可以更直观,更高效。增强PPT渲染力,说服力。也更符合现代人的需求,随心所欲更智能化。所选用Kinect体感手势识别传感器,其能够捕捉、跟踪以及解密人体的动作和手势,它通过对深度图像和骨骼图像的分析实现动态手势识别。在骨骼图像的20个骨点中选取至少2个有效骨骼点,通过追踪这些骨骼点的位置来实现对手部的追踪;再通过对手部深度图像的分析来实现动态手势识别。
  一、Kinect的简单介绍
  (一)Kinect简介
  Kinect是微软为其Xbox 360游戏主机和Windows平台PC打造的一款运动感知输入设备,作为一款体感外设,它实际上是一个采用全新空间定位技术(Light Coding)的3D体感摄像头,利用即时动态捕捉、影像辨识、麦克风输入、语音辨识、社群互动等功能,允许玩家使用身体姿势和语音命令通过自然用户界面技术与Xbox 360交互,从而完全摆脱了传统游戏手柄的束缚。
  (二) Kinect的主要配置有
  RGB摄像头:为Xbox 360提供红、绿、蓝三颜色通道,主要作用在于面部识别和动作追踪;
  深度传感器:深度传感器有红外线投影机加单色CMOS传感器组成,虽然功能并不复杂,但它可以让Xbox 360真正“看到”3D空间,而不是通过计算得出空间数据;
  多点阵麦克风:主要功能是为了聊天以及语音命令识别,并可以帮助过滤环境噪声;
  定制处理器和微软的定制软件:所有硬件都由微软设计的软件控制,商业目的。
  (三)结构
  Kinect有三个摄像头,中间是一个RGB摄像头,用来获取640×480的彩色图像,两边是两个深度传感器,左侧的是红外线发射器,右侧的是红外线接收器,用来检测玩家的相对位置。Kinect的两侧是一组四元麦克风阵列,用于声源定位和语音识别。
  (四)kinect for windows SDK 功能介绍
  骨骼追踪:对在Kinect视野范围内移动的一个或两个人进行骨骼追踪,可以追踪到人身体上的20个节点。此外,Kinect还支持更精确的人脸识别。
  深度摄像头:利用“光编码”技术,通过深度传感器获取到视野内的环境三维位置信息。
  音频处理:与Micorsoft Speech的语音识别API集成,使用一组具有消除噪声和回波的四元麦克风阵列,能够捕捉到声源附近有效范围之内的各种信息。
  感应器:彩色和深度镜头,辅助感应倾斜驱动马,达完全相容所有Xbox 360装置。
  二、Kinect程序流程
  基于Kinect SDK中的API函数完成kinect解决方案,如下图所示,主要包括5个部分:初始化,获取图像,分析跟踪状态,显示图像,以及退出。下面将分别介绍。
  Kinect SDK中的API函数以“Nui”开头,一般命名为“NuiXXXX”。为了与Kinect SDK中的API函数区别,kinect解决方案中的函数均以“KinectXXXX”命名,内部调用Kinect SDK中的API函数。
  (一)初始化
  对应KinectNuiInit()函数,初始化Kinect设备,设置摄像头仰角,打开颜色流、深度流和骨架流。
  (二)获取图像
  对应KinectGetDepthImage()、KinectColorFrameToImage()和KinectGetSkeleton()函数,从颜色流、深度流和骨架流中获得数据帧,转化为openCV中的IplImage图像类型。
  上面的3个函数调用了KinectGetFrame()、KinectDepthFrameToImage()和KinectColorFrameToImage(),获取数据帧,并且转化为对应图像类型。
  (三)分析跟踪状态
  对应KinectJudgeTrack(),判断当前的跟踪状态以及控制权所示情况。
  KinectJudgeTrack()调用了KinectPointDistance()和KinectPointHorizontalDistance(),求出两点之间的距离以及两点之间的水平距离。
  三、演示系统结构
  (一)演示框架
  本文的虚拟演示系统是通过对骨骼数据的追踪来捕捉人体的动作来控制图片的移动,放大,缩小,旋转等操作,从而形成一个能与人交互的一个虚拟演示系统,总体结构如下:
  图1 系统操作方案
  (二)对骨骼数据的追踪
  先定义骨骼点,通过定义的骨骼点确定骨骼位置;再定义一个骨骼状态函数,通过这个骨骼状态函数来捕捉人体的动作,最后通过时间模型来对骨骼数据进行追踪。
  图2 骨骼追踪模式
  (三) 图片操作
  通过对骨骼的追踪,确定到手的位置,然后定义操作的动作来识别是对图片进行什么操作。先获取图片的中心位置,然后在进行操作。
  图3 图片操作方案
  (四)视频窗口
  定义一个KinectSensor对象用来表示Kinect设备,定义一个数组来存放获取到的图像数据,再通过Loaded方法来来初始化视频数据并接收视频流,最后利用kinectSensor_ColorFrameReady方法来获取视频数据并显示出来。
  图4 数据采集结构
  (五)预演示
  该方案应用体感外设作为LED全彩屏的手势输入终端。设备通过识别操作者的手势、动作来实现LED全彩屏的动作。
  手势输入终端是一种新型的输入终端,它不同于传统意义上的输入终端,比如键盘、鼠标、游戏手柄等,它通过人体的手势以及动作将操作指令下达给设备。
  本方案将体感外设作为新型的输入设备操作LED全彩屏,颠覆了以往LED屏只能显示无法互动的缺点。改变了以往LED显示后台操作的模式,实现了观众即是操作者的设计理念。
  通过体感外设可以准确将用户轮廓提取出来,通过轮廓提取用户动作信息,并对用户信息进行建模。
其他文献
教育事业在当前的发展形势下发生了改变,体育教育的实施对学生身体素质的培养有着促进作用.乒乓球教学是职业技术学校中比较重要的一项课程,而且也深受学生们的喜爱.职业技术
甲亢是一种自身免疫性疾病,药物治疗主要是控制症状,使疾病顺利度过自然病期,达到治愈目的。但由于甲亢疗程长、复发率高,有的患者愈后留下终身突眼或甲状腺肿大症状。近年来,随着科技发展,诊治甲亢有了一些新观念,有助于解决上述问题。   短疗程向长疗程转变20世纪50年代,抗甲状腺药一般服用6~12月即停用,复发率在50%以上;80年代主张将疗程延长到1.5~2年,复发率降到25%。现在主张将疗程延长到2
在概念教学中要引导学生找出概念的纵向和横向联系,促成概念的系统,穿线结网,转化成学生头脑中的概念的认识结构.这种系统的认知结构不仅有利于概念的巩固、深化,也有利于知
随着新课程改革的深入开展,教师在教学中不能再仅限于为学生传授知识和技能,更要注重发展他们的综合素质,培养学生的学科核心素养,促进教学有效性的提升.对于小学语文来说,要
内部审计作为组织内部的一种独立客观的监督和评价活动,是通过审查和评价经营活动及内部控制的适当性、合法性和有效性,来促进组织目标的实现.从目前来看,我国企业内部审计的
古诗词是华夏文化遗产中的瑰宝,是文学创作中的一颗璀璨的明珠,它具有独特的表现手法,寓意深刻,耐人寻味,是提高审美能力、丰富语言、陶冶性情的最佳选择.同时古诗教学是语文
摘 要:随着党的群众路线教育实践活动和“三严三实”专题教育的开展,对企业领导人员提出更高的要求,本文从怎样提升为员工服务能力和水平;立足行动,搭建员工与企业心连心桥梁;严格要求自己,做员工拥护的表率三个方面阐述怎样与员工面对面心贴心。  关键词:企业;领导;员工;心贴心  去年,各政府机关和国有企业都开展了以为民务实清廉为主要内容的党的群众路线教育实践活动,今年各政府机关和各企业又开展了“三严三实
52岁的王大哥,缓起食欲不振、纳差、厌食、腹泻、便秘,或腹泻与便秘交替反复发作5年,曾经被诊断为胃炎、慢性结肠炎。多方治疗经久不愈,日趋恶化,一米七的男子汉,体重只有35公斤且卧床不起。近期又出现黄疸,疑为肝癌转来我院。经过详细的检查,最终确诊为甲亢。患者及家属在得知不是癌症而感到欣慰之余,还产生很多疑问……    甲亢为什么会顽固性腹泻  甲状腺是人体最大的内分泌腺体,位于颈部气管的两侧。它能够
医生:rn我的女儿小艾今年一岁半,白白胖胖的特别招人喜欢.小艾最爱看电视,每次都是一边拍着手,一边咯咯地笑个不停.可是,问题就出在看电视上.一次,姥姥抱着她看“动物世界”
肾盂输尿管连接部梗阻是儿童肾积水最常见的原因。我们2008年2~12月采用微创开放切口离断性肾盂成形术治疗小儿肾盂输尿管连接部梗阻57例,均采取单次硬膜外麻醉,现报道如下。