论文部分内容阅读
随着智慧城市和平安城市的建设,以及摄像头成本的降低,越来越多的摄像头被部署到城市的大街小巷,这导致视频数据的爆炸式增长,从而对视频分析处理技术的需求也越来越急迫。在本文中,笔者致力于通过研究中层判别性特征块来解决视频中人体动作的预测问题。本文的工作主要从中层判别性特征块和动作预测这两个方面进行展开和讨论。 第一,为了解决视觉底层特征和视觉高层特征不能够充分挖掘人体信息的问题,本文选择从中层判别性特征入手,通过借鉴Singh等人的工作,把中层判别性块的挖掘方法迁移到人体动作分析问题上来。本文直接从人体动作视频序列中提取二维的人体中层动作特征,而所提取的人体中层特征块具有类间判别性和类内代表性这两个底层和高层特征所不具备的特性。此外为了探索不同中层特征检测器如何进行优化组合的问题,本文还研究了基于这些中层特征块的直方图表达,探索了不同直方图表达之间的优缺点。 第二,针对视频中人体动作预测这个问题,本文提出了基于中层判别性特征的动作自动补全模型。由于现有的动作识别技术都是注重动作视频的事后分析,不能够实时地给决策者提供分析结果,而人体动作预测算法在进行视频分析的时候则不需要拥有完整的人体动作信息,不需要等到整个人体动作都完结,所以人体动作预测技术是将来的发展方向之一。在本文中,受到查询自动补全(query auto-completion,QAC)思想的启发,针对性地提出了一个新的基于中层判别性特征的动作自动补全框架(activityauto-completion,AAC)。本文提出的AAC人体自动补全模型能够在不完整视频观测下给决策人员推荐高质量的人体动作候选列表。此外,本文提出的算法在多个不同的人体交互数据库上都取得了较好的实验结果。