论文部分内容阅读
近年来,体育视频分析在视频摘要、视频检索等相关应用领域取得了许多进展,已成为多媒体领域的研究热点。当前体育视频分析限于事件提取、精彩片断检测等简单任务,缺乏对事件内容细节、技战术模式等深层次语义内容的挖掘,无法满足广大体育爱好者和专业人员的深层次检索需求。而且,当前研究大多针对特定的体育视频,缺乏系统化、结构化、可扩展到不同类型体育视频的通用性框架及方法。
针对上述问题,本文开展了体育视频内容挖掘技术研究,对视频内容进行更深层次的挖掘和理解,系统化、结构化的分析视频内容。为此,本文提出了一种通用的广播体育视频内容挖掘框架,该框架概括了体育视频内容挖掘从低级特征提取到高级语义内容分析的一般过程,涵盖了从语义镜头分割、一般语义事件分析到技战术模式等高级语义内容挖掘的多个层次的内容分析、理解,适用于不同类型的体育视频。本文以足球等比赛视频为典型代表,对该框架中提出的视频结构化、精彩事件提取、语义事件分析和技战术模式分析四个方面的内容进行了研究,取得了以下研究成果:
1.基于统计的体育视频结构化
体育视频结构化是指提取视频中的语义镜头和语义场景,是体育视频内容挖掘的基础和关键问题。本文提出了一种基于统计的通用体育视频镜头分割和分类方法,采用不依赖于先验规则和知识的特征,可对不同类型的体育视频进行镜头分割和分类。该方法将镜头分割和分类任务形式化为一个求解最大后验概率问题,利用镜头内在的特征和镜头间的转换关系同时进行镜头分割与分类。与传统的先分割后分类的方法相比,这种方法有效地提高了分割分类的准确率。在足球和羽毛球视频上的实验结果表明了本方法的通用性和有效性。
2.基于关键对象检测的体育视频精彩事件提取
精彩事件/片断是整个视频中最能引起用户兴趣的一部分内容,因此,精彩事件/片断提取是视频内容挖掘研究的最基本任务。本文提出了一种基于关键对象检测的精彩事件提取方法。该方法首先检测视频中的关键对象,如足球视频中的球门、球门线,网球视频中的球拍等,在此基础上结合不同类型语义镜头之间的转换关系,提取视频中的精彩事件/片断。在足球视频上的实验表明,该方法的检测准确率高达90%以上,并且可达到实时处理速度。
3.基于统计的体育视频重放检测方法
在广播体育视频中,通常含有一类特别的视频特效——重放。由于重放通常是对视频中最为精彩片断的慢速回放,重放的检测对于视频中精彩片断提取具有重要的意义。为此,本文提出了一种基于统计的通用的重放检测方法,该方法在视频场景标注的基础上通过镜头长度的概率分布估计重放片段的最佳边界。在足球视频上的实验结果证明该方法能有效地去除误报,同时调整重放边界,获得更为准确的重放检测结果。
4.融合多模态的体育视频事件分析
视频事件分析是指挖掘事件的内容信息,得到事件详细的属性描述,是视频内容挖掘面向个性化检索需求的重要体现。本文提出了一种基于动态规划融合网上文本信息的体育视频语义事件分析方法,采用全局匹配的方法对齐视频和文本中的事件描述信息,并采用全局概率模型优化对齐结果。该方法不仅能定位事件在视频中的时间,而且能够挖掘事件内容相关的描述信息,使用户灵活、便捷地搜索所需的视频片断,满足其个性化的内容检索需求。实验证明该方法能有效避免了当前常用的局部匹配方法造成的漏检和误检,更加快速、准确的检测语义事件,获得详尽的事件内容信息。
5.基于焦点运动员检测的足球视频进攻战术分析
体育视频战术模式分析自动挖掘比赛视频中的战术信息,帮助体育专业人士更好地指导比赛和训练,对于提高团队的技战术能力有着重要的意义,其重要的实际应用价值已开始受到众多研究者的关注。以足球视频为例,本文提出了一种基于焦点运动员检测的多人场地体育视频的战术分析方法。该方法在运动员分割的基础上采用基于时空最短路的算法检测焦点运动员(控球运动员)位置轨迹,从焦点运动员的变换和位置轨迹中挖掘进攻战术模式。与传统方法相比,该方法无需多目标跟踪和轨迹识别,得到的战术分析结果更加准确。