基于判别性特征的动作预测

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:woshizhaozhiqiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智慧城市和平安城市的建设,以及摄像头成本的降低,越来越多的摄像头被部署到城市的大街小巷,这导致视频数据的爆炸式增长,从而对视频分析处理技术的需求也越来越急迫。在本文中,笔者致力于通过研究中层判别性特征块来解决视频中人体动作的预测问题。本文的工作主要从中层判别性特征块和动作预测这两个方面进行展开和讨论。  第一,为了解决视觉底层特征和视觉高层特征不能够充分挖掘人体信息的问题,本文选择从中层判别性特征入手,通过借鉴Singh等人的工作,把中层判别性块的挖掘方法迁移到人体动作分析问题上来。本文直接从人体动作视频序列中提取二维的人体中层动作特征,而所提取的人体中层特征块具有类间判别性和类内代表性这两个底层和高层特征所不具备的特性。此外为了探索不同中层特征检测器如何进行优化组合的问题,本文还研究了基于这些中层特征块的直方图表达,探索了不同直方图表达之间的优缺点。  第二,针对视频中人体动作预测这个问题,本文提出了基于中层判别性特征的动作自动补全模型。由于现有的动作识别技术都是注重动作视频的事后分析,不能够实时地给决策者提供分析结果,而人体动作预测算法在进行视频分析的时候则不需要拥有完整的人体动作信息,不需要等到整个人体动作都完结,所以人体动作预测技术是将来的发展方向之一。在本文中,受到查询自动补全(query auto-completion,QAC)思想的启发,针对性地提出了一个新的基于中层判别性特征的动作自动补全框架(activityauto-completion,AAC)。本文提出的AAC人体自动补全模型能够在不完整视频观测下给决策人员推荐高质量的人体动作候选列表。此外,本文提出的算法在多个不同的人体交互数据库上都取得了较好的实验结果。
其他文献
随着web2.0技术的普及和飞速发展,互联网数据出现了爆炸性的增长。为有效存储和管理如此大规模的数据,诸多研究机构和公司都提出了各自的数据存储方案。其中影响最大的莫过于开
近年来,随着运营商的重组以及新的竞争格局逐步形成,面对迅速发展的通讯技术、激烈竞争的市场形势、新业务不短增加,新技术不短涌现,为了满足客户更多更高的要求,提高联通运营商的
概率检索模型是动态信息检索系统的组成部分。概率检索模型的任务是计算文档集合中各个文档的相关得分,其结果是检索系统返回的文档排序的主要依据。概率模型的性能优劣直接影
富媒体资源是指以文本、图片、音频、视频、Flash及其组合为表现形式的数字化作品或素材。作为数字作品中的一种,其应用越来越广泛,由于富媒体资源具有易传播、易复制且几乎无
随着数字媒体设备的迅速发展和广泛应用,多媒体产品近年来呈现出爆炸式的增长趋势。由于在数字图像,视频处理的各个领域:采集、显示、存储、传输、压缩等都需要进行质量评价,因
近年来,随着互联网上文本数据的急剧增长,如何利用自然语言处理技术高效地对海量数据进行处理,成为人们关注的焦点。句法分析作为自然语言处理领域的基础技术,是对文本进行深入理
以Web3D为代表的虚拟现实技术,因具有浸没感、交互性和构想性等特点在医疗、军事、工业制造、教育、旅游等各领域得到了广泛应用。EAST(Experimental AdvancedSuperconducting
高阶多项式矩阵的行列式计算是符号计算中的一个重要研究课题。因其矩阵元往往是多变元高幂次多项式,故采用传统的子式展开或Gaussian消元法将带来巨大的中间表达式膨胀,从而导
多目标跟踪问题是计算机视觉领域的一个重要问题,涉及模式识别与智能系统、传感器、图像处理、统计与机器学习等多个领域的相关技术。多目标跟踪的主要任务是对视频序列中的多
ESL设计和验证是一种新兴的电子设计方法,它提供给软件和EDA工程师提供一个虚拟平台,用以进行硬件系统架构的探索和嵌入式软件程序的开发。通信系统是一个结构复杂的系统,在对原