基于贝叶斯多核学习的行为识别

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:xuan21456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于最近几年视频数据量的爆炸式增长,视频分析与理解变得越来越重要并且吸引了大量的研究兴趣。在视频分析与理解领域,对于视频中人体行为的识别是一个活跃的研究方向。在众多领域的应用前景激发了行为识别问题的研究,如智能视频监控,人机交互和视频检索以及医疗诊断等。然而由于行为表现的差异,光照变化,相机运动和遮挡等因素,使得这一任务极具挑战。  基于视频的人体行为识别的主要任务是让计算机自动的对视频序列中的人体行为进行识别。通常情况下,一个简单的人体行为识别系统的基本工作流程可以描述如下:首先对输入的视频进行特征提取以获得具有较强描述力的特征,再将提取得到的特征转化为行为表示,最后通过机器学习方法对得到的行为表示进行学习分类,进而实现对人体行为的模式识别。  之前对行为识别问题的研究将更多的注意力放在了设计对行为识别问题有描述力的特征上,也因而涌现了大量的特征。然而一种类型的特征的表达能力是有限的,不能充分的捕捉视觉特性。对多种特征进行融合,集成多种有信息的特征,是一个在直觉上合理的方法。然而,目前大多数的行为识别方法对多种特征的融合采用简单的方法,不能够衡量每种特征的贡献,也不能保证融合后的效果相比于只使用单个特征会有提升。因此,本文致力于提出一种有效的融合方法,可以衡量每种特征的相对重要性,学习最优的特征的结合,充分利用每种特征的优势。并将其应用于人体行为识别问题,以在实验中获得更好的分类表现。论文的主要工作和贡献可以归纳如下:  1.提出了一种新的建立在分层贝叶斯框架下的基于多核学习方法的特征融合方法,分层贝叶斯多核学习方法。具体的,我们以多核学习方法为理论指导,采用线性加权和作为核结合的函数形式,使用贝叶斯方法对核结合函数形式中的参数加以先验假设,对应建立三层的概率图模型,最后使用变分贝叶斯方法对参数进行推断。我们的融合方法能够自动学习多种特征在结合时的最优权重,进而有信息的将多种特征的互补特性发挥到最大。多组实验表明,该方法能够有效的对多种特征进行结合,获得优于单特征和现有特征融合方法的表现。  2.提出了一种基于特征融合的人体行为识别算法。针对目前人体行为识别算法所使用的融合方法不能衡量每种特征的贡献,从而有效融合的问题,本文将我们提出的基于分层贝叶斯多核学习方法的融合方法应用于人体行为识别问题。我们提取多种特征并计算相应的特征核,这些特征核即对应多核学习方法的基核。为了形成对视频中行为的充分描述,我们提取了传统手工特征与深度学习特征。这些特征在描述视频时是互补的,包括了静态表观信息与动态运动信息,还包括了局部信息与全局信息。我们在多个具有不同复杂度的公开人体行为识别数据库上进行了一系列实验,我们基于特征融合的人体行为识别算法在多个数据集上取得了有竞争力的效果,实验结果证实了我们提出的方法的有效性。  3.通过我们的分层贝叶斯多核学习方法,分析针对不同特点的数据集中的视频行为,不同特征在分类时的贡献大小。虽然对人体行为识别的研究已展开多年,但关于在识别过程中,哪种类型的特征所做的贡献更大以及深度学习特征与传统手工特征的关系鲜有人给出分析。我们的分层贝叶斯多核学习算法除了可以有效的对多种特征进行结合,还可以对每种特征的贡献给出启示。由于不同特征所对应的基核在构成合成核时的权重是完全由数据驱动的,通过对实验中得到的核权重进行分析,我们得到了一些结论,相信可以对人体行为识别问题的研究有一定的借鉴意义。
其他文献
文物是人类在其历史发展过程中遗留下来的遗物、遗迹。文物的保护管理和科学研究,对于人们认识自己的历史与创造力,揭示人类社会发展的客观规律,认识并促进当代和未来社会的发展
自大数据时代到来之后,其对各行各业产生了深远的影响。同时,大数据下数据的表现形式也越来越多样,比如描述一个网页,可以由网页上的图片、文本和超级链接进行表征。又例如,描述一
文字作为人类语义信息的直接表达,在日常生活中有着重要的作用。图像中的文字通常可以直接反映出内容信息,其识别受到越来越多研究者的关注。但是图像文本中复杂的图像背景以及
本文针对基本粒子群算法易陷入局部极小点,搜索效率不高等缺点,提出了基于双变异算子的混合粒子群优化算法(Hybrid Particle Swarm Optimization Algorithm Based onDual Mutat
论文的研究工作主要以提高和改善感应电机直接转矩控制(DTC)系统调速性能为目的,分别针对DTC控制中的前向控制通道、磁链和转矩观测通道以及无速度传感器的速度辨识进行了研究
粒子群优化算法(Particle Swarm Optimization,PSO)是在对鸟群捕食行为模拟的基础上提出的一种群智能算法,是一种新兴的优化工具。基于其较快的收敛速度,方便的参数调整和较
现代战争中精确制导武器的使用越来越广泛,而惯性导航系统由于其自主性强的特点,在制导武器中具有重要的地位。本文主要研究了某发展型空射反辐射导弹捷联惯导系统的简化方案、
氨在我国化工生产中的占有重要地位,合成氨产量吨位大,与国民经济关系密切,特别是对发展农业具有主要意义的化工产品,主要用作肥料和生产其他氮肥的原料,氨合成塔是合成氨生产过程
目前,嵌入式控制器已经广泛应用于设备的控制系统中,在人类对设备的依赖性增强的同时,设备的安全性、有效性、可靠性对安全生产至关重要,设备和系统一旦发生故障,轻则导致经济损失
随着科学技术的不断进步,现场总线技术得到了飞速发展,已经成为过程控制领域的一大热点。尤其是HART协议,以其独有的优势和特点,得到了越来越广泛的应用。因此,HART多路复用器的研