基于多层动态Bayesian网的视频行为识别研究

来源 :中山大学 | 被引量 : 0次 | 上传用户:kaifeng_chen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频行为识别(Behavior recognition,BR)是指依据运动目标的视频,提取目标的行为特征信息,建立行为特征信息与高层行为语义之间的函数映射,实现视频行为识别,是多媒体信息高级语义理解和模式识别的一个重要研究方向。视频行为识别方法,涉及到特征提取和选择、信息处理、计算机视觉和模式识别领域。在科学研究和智能视频监控、高级接口和多媒体信息检索等方面具有重要的理论和应用意义。   本文在阐述Bayesian网理论的基础上,实现一种基于多层动态Bayesian网的模型(Multi-layer dynamic Bayesian network,MDBN),以及基于该模型的视频行为识别方法(BR based on MDBN,MDBN-BR)。主要研究工作和创新点为:主要研究工作和创新点为:(1)实现基于多层动态Bayesian网络的视频行为表示模型MDBN;(2)基于MDBN模型进行视频行为识别MDBN-BR,(3)综合视频行为的轨迹特征和光流特征两种运动特征进行行为识别;(4)采用将这两种特征组成的向量分解为维度相等的特征向量,作为MDBN模型两个层次观察量输入的综合策略。MDBN-BR方法的关键过程为三个:模型建立、参数学习和推理识别。参数学习和推理识别分别采用经典方法期望值最大化(EM)算法和联合树(Junction tree)推理算法实现。本文对这三个关键过程进行详细介绍和分析。从理论上,MDBN模型实质是扩展的Bayesian网络,具有可以表现变量间因果关系和将变量空间分解为局部空间表示联合概率的优点,因此,MDBN-BR方法采用MDBN模型将轨迹特征和光流特征综合的策略具有一定的合理性,并且,与HMM方法相比,降低了状态量与观察量依赖的维度;从实验上,MDBN-BR与层次HMM方法在采用同样训练集和测试集的基础上分别实现,并从识别性能和识别鲁棒性两个角度进行详细比较,实验结果表明,采用MDBN综合两种特征的策略相比HMM采用单一向量的策略,具有较好的结果。
其他文献
在传统的信息检索中,检索模型是在静态数据集上训练得到的,模型一经训练,结构和参数都相对固定下来,没有根据新的数据自动修正的机制。但现实中,Web上的信息是实时更新的,经
智能卡的名称来源于英文名词"Smart Card",智能卡属于IC卡(集成电路卡)的一种。它是一种带有微型CPU处理器和存储器等微型集成电路芯片且具有标准规格的卡片。由于智能卡具有
计算机程序设计是一种抽象且调试成本较高的过程,需要功能丰富和高效的可视化开发工具及环境的辅助。目前的主流开发工具只是在设计过程提供了静态可视化功能,而在调试过程缺
排课问题对于每个学校的教务管理来说都是非常重要的,现在是信息的社会,在学校的教务管理中实现排课的智能化,可以快速高效的对课程进行编排,对整个学校的教学体制的管理具有
万维网是一个巨大的、分布广泛的、全球性的信息服务中心,它涉及到人们生活中的方方面面。人们不再对网站、网页这些名词感到陌生了,政府机关、高校、公司都搭建了自己的网站,而
面向服务的架构(Service-Oriented Architecture,简称SOA)是指为了解决业务集成的需要,通过连接能完成特定任务的独立功能实体实现的一种软件系统架构。SOA是一个组件模型,它
随着网络规模的日益增大,网络结构也异常复杂,现有的入侵检测系统很难适应大规模分布式网络的安全需要。免疫系统以其在信息处理中所表现出来的分布式保护、自适应性、鲁棒性、
说话人识别是指通过说话人的语音来自动识别说话人的身份,作为生物证认技术的一种,它在许多领域里有着良好的应用前景和巨大的市场潜力。本文通过分析说话人识别的原理与系统
智能视频监控融合了计算机视觉、图像处理、模式识别、人工智能等多个学科的知识,是计算机视觉领域一个新兴的应用方向和备受关注的前沿课题。智能视频监控在不需要人为干预
随着云计算与大数据技术的迅速发展和应用,海量数据的存储和管理问题成为人们关注的焦点,对数据存储的灵活性、可扩展性以及并发性等都提出了更高的要求。众多的互联网应用使