基于部件模型的人体动作检测与识别

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:cjing010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别的关键问题是如何从底层数据中有效地挖掘高层语义信息,使计算机能够理解人类行为并更好地为人类服务。人体动作识别的研究融合了计算机视觉、图像处理、模式识别等多学科的研究成果,是一个多学科融合的重点研究方向。在人体动画、游戏、虚拟现实、人机交互、视频监控、体育运动分析、辅助临床医疗诊断等领域均有着广阔的应用前景。   近年来,大批研究者投身人体动作识别方向的研究,并取得了丰硕的研究成果。然而,这门研究还处于研究初期,现有的动作识别方法大都对视频采集环境及人体动作等做了严格的限制,距离实际应用还存在较大的差距。   本文的研究从人体的部件入手,挖掘不同人体动作中部件的表观及空间配置关系的变化。针对人体部件的不同组织模式,本文提出了两种人体动作的定位及识别方法,主要的研究内容与贡献总结如下:   (1)提出了一种基于人体姿态表示的动作定位与识别方法。其主要优势:(i)将人体检测、姿态估计与动作识别整合到一个统一的框架,避免了对前端的背景分割、人体检测跟踪等预处理步骤的依赖;(ii)提出了一种基于可变形部件模型的人体姿态及动作的特征表示方法,能够有效地编码人体部件的表观及空间配置特性;(iii)该方法能够同时定位和识别人体动作,具备在较为复杂场景下的多人多类动作同时定位与识别的能力。最后,我们通过广泛的实验验证了算法的有效性。   (2)提出了一种基于判别霍夫变换的动作检测方法,训练过程构建各动作的局部特征码本,测试过程将所有采集的局部特征与码本中码字进行匹配,利用匹配码字的统计信息对人体动作的中心位置进行投票来定位人体运动作。我们将霍夫变换放入一个判别式的学习框架中:(i)词典学习方面,将局部特征的表观信息与其空间分布信息融合在一起,为每个码字训练了一个判别函数作为局部特征与该码字的匹配度量;(ii)权重学习方面,采用了最优化准确率的判别式学习策略得到了一组最优权值,为每个码字的投票值进行了加权。最后,在面向图像帧的动作检测的实验中,我们的方法取得了令人满意的结果。
其他文献
互联网作为当今社会最重要的信息基础设施,极大提高了人类社会生产以及生活的效率,但互联网的不可信因素降低了互联网作为基础设施的应用价值。为解决这样的问题,有学者提出对当
三维增强绘制是一种关注于信息表达的绘制方式,强调对物体表面特征的增强,例如物体的表面细节、明暗对比度、高光等,突出真实场景的某些显著信息,从而生成更清晰、更易于理解的绘
利用串联质谱进行肽段和蛋白质鉴定已经成为蛋白质组学的核心技术。目前,基于串联质谱技术的蛋白质鉴定主要有两条技术路线:数据库搜索(Database Searching)和肽段从头测序(D
地理图片共享已逐渐成人们网络社交活动中的重要组成部分,既包含图片拍摄时的地理信息,又蕴含着人们的喜好、意图和形为模式,同时大量地理图片数据揭示着人们活动的共同规律
上世纪90年代,在生产流程的潜力已经挖掘到极限的情况下,各国的企业家,专家和学者们开始集中在业务流程的优化,并从很多角度,进行了大量的研究,尤其是美国,对业务流程的投资
现场可编程门阵列FPGA是一种包含可编程元件的半导体器件,可供用户现场编程,具有设计开发周期短、设计制造成本低、可反复编程、灵活性高等优点。目前,FPGA已广泛应用于空间
EAST数据系统是EAST聚交实验的重要组成部分之一,它主要用来采集、存储、分析、发布和可视化EAST实验数据,为物理研究人员分析和处理EAST实验数据提供平台。而EAST数据采集控制
三维几何建模是计算机图形学中的关键技术,是进行后期渲染、动画制作等步骤的必经环节,具有重要的研究和应用价值。点云数据作为真实世界中物体的三维几何形状的最重要的离散
三维变分资料同化系统3DVAR作为现在主流数值天气预报的同化方法,能明显改善预报数据的同化质量,随着科学研究的逐渐深入以及科学探测仪器和计算机的技术的不断发展,传统串行三
随着J2EE的发展,服务器领域的Java应用越来越多,典型的有hadoop、tomcat、weblogic和websphere,其中绝大多数是基于SunJDK6开发的。近年来国产CPU发展迅猛,其中具有代表性的