基于人物交互动作行为识别方法研究

来源 :内蒙古科技大学 | 被引量 : 0次 | 上传用户:tewy001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别技术的飞速发展,使其逐渐渗入到许多行业,是计算机自动理解真实场景的重要步骤,有着广阔的应用前景,越来越多的研究人员对其投入研究。通过分析人体行为的复杂度,发现相对于单人行为而言,交互行为的识别存在复杂性高,冗余信息量大,特征维数高且难以区分等特点,因此交互行为的特征选取及表达对识别算法起着至关重要的作用。对交互动作的研究大部分基于RGB图像,虽然取得了较好的研究成果,但也存在一定的局限性。对于RGB图像,复杂的背景,光照强度,角度等因素都会给交互行为识别带来影响,使得识别率降低。所以在本文中,主要对如何结合深度图像选取交互动作的特征提取以及优化算法效率进行重点研究。本文的研究工作如下:利用多源信息的互补性,相应地提取了各自的特征。本文首先对深度图像采用Canny算子提取边缘特征,对RGB图像采用局部二值模式算子旋转不变模式提取纹理特征,采用光流直方图来描述动态特征;然后对提取的边缘特征及纹理特征进行加权融合;之后利用基于稀疏编码空间金字塔匹配模型(对静态融合特征和光流运动轨迹特征进行编码池化,将得到的池化特征再融合;最后采用支持向量机(Support Vector Machine,SVM)进行分类,实现交互行为识别。针对特征的贡献,使用权重融合机制择优特征融合。交互动作的复杂程度高,信息冗余量大,需要提取更强大的特征,针对此问题,本文采用低秩稀疏优化算法,最大程度上去除冗余和噪声的干扰,提取出干净的低秩矩阵。本文采用鲁棒主成分分析法提取融合编码特征的低秩矩阵,最后对特征的低秩矩阵采用SVM算法分类识别。针对复杂性问题使用稀疏超完备字典的方法压缩空间,使用低秩稀疏优化算法提高算法的效率,降低算法的复杂度。为了证明本文提出算法的有效性及优越性,在几个公共的行为数据集上进行实验,其中包括CAD-60数据集,MSR Action Pairs数据集和SBU数据集。采用前两个数据集对人物交互动作进行识别,采用第三个数据集对双人交互动作进行识别。本文在每个数据集上都和其他文献优秀的算法进行了对比,实验结果表明,本文提出的算法识别结果有所提高。
其他文献
为更加有效避免不吸烟人群受到危害,并美化室内外环境,本研究基于控烟这一主要目标,提出室外公共吸烟亭的设计原则与方法,以满足人们日常生活与工作的需要。
近年来,世界上许多国家为提高农业综合效益,都加大了对农副产品的深加工开发力度。而利用农副产品生产环保型塑料包装材料已成为科研领域的研究热点。
利用现代生理生化手段测定兔酒精麻醉后其体内的生理生化指标的变化为临床诊断疾病提供理论依据。试验结果显示:家兔在酒精麻醉初期心率和呼吸率明显加快,血中甘油三脂和胆固醇
开发一个WEB系统,选取何种开发工具显得尤为重要。在科技迅猛发展的今天,可供选择的开发工具越来越多.本文以JSP、ASP、ASP.NET举例,对三种技术进行介绍和比较.从而找出适合实际系
期刊
猫道为大跨径悬索桥施工必备的临时结构,为主缆架设、索夹和吊索安装、钢箱梁吊装、主缆防护等提供施工操作平台、材料及工具运输通道,从始至终贯穿整个悬索桥上部构造安装施
现代通讯技术的不断进步.为广播新闻连线报道提供了有力的技术支撑,而新闻连线报道的出现,也大大丰富广播新闻报道的形式。广播连线报道以其时效快、操作简单、成本低,将广播的优
当代资本逻辑中最重要的构序要素是景观,景观以吸引人的图像、声音、复杂叙事情境和现场塑形的享乐诱惑,紧紧抓住听众、观众和消费者,以建构一个无意识层面上被感动、被吸引
本文回顾了医疗管理中大数据的定义, 过程和使用. 非结构化数据增长速度比半结构化和结构化数据快得多. 90%的大数据采用非结构化数据的形式, 医疗行业大数据管理的主要步骤
高速公路加快推进其信息化与智能化建设,是提升高速公路运行效率,满足社会经济发展需求的关键。文章通过分析高速公路信息化与智能化建设的重要意义,探讨了当前高速公路信息
印刷品上油墨层的厚薄对印刷品的质量影响较大,应从实际生产情况如油墨的性质、版面结构、印刷机速度、环境温度、相对湿度、纸张的吸收性和平滑度情况,以及印刷产品图文分布等