基于音视频融合的电影暴力内容检测研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:MyLoverQLH
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术和电影工业的发展,越来越多的视频内容广泛流传,而其中或多或少地存在着一些暴力内容。一方面,暴力场面容易吸引观众的注意,属于影片中的精彩内容,研究和分析暴力内容对自动生成影片摘要和精彩内容检索具有辅助性研究价值;另一方面,通过对暴力程度的鉴定,可以过滤掉一些不适宜儿童观看的过度暴力的镜头,因此,合适的暴力评定方法有利于推动电影分级等相关工作的发展。人工标识与过滤暴力内容也终将因成本高、速度慢而跟不上视频产业发展的步伐,所以人们期待它可以被自动识别与标注技术所取代。本文在分析了电影拍摄手法和表现手段的基础上,对影视内容中的暴力事件展开研究,并建立了层次型的暴力内容自动检测模型。首先利用半监督的学习方法,从连续的视频流中检测出快节奏、大音量、少对话和轻音乐的候选暴力镜头;继而在这些候选镜头中进一步检测爆炸、枪击、打斗、刀剑、撞击、引擎等具体的暴力相关事件,并推断它们与暴力的相关程度,从而根据其在镜头中的分布,计算出镜头的暴力分值;最终将这两个阶段的结果融合,对整部影片得到以镜头为单位的连续的暴力程度曲线。本研究主要内容及结果如下:   ⑴提出了通用的暴力内容自动检测框架。该框架从暴力内容的特点出发,不仅能够检测由“枪击-爆炸-追车”等因素构成的好莱坞式暴力场景,也适用于以“搏击-刀剑”构成的冷兵器暴力场景检测。在音视频特征集合上,以镜头为基本单位,一方面把暴力理解为一种统一的抽象概念,检测出快节奏的镜头作为候选检测集,将暴力场景与慢节奏舒缓场景予以区分;另一方面用一些具体事件的组合来描述暴力,通过检测这些暴力相关事件,将暴力内容与体育运动等快节奏视频予以区分。   ⑵改进了SCFL半监督学习方法用于候选暴力镜头检测。由于有监督学习需要大量的训练样本才能正确地描述特征空间分布,而样本标注工作耗时费力,需要投入大量人力。考虑到标注成本和特征集合自身的特点,本文在音视频底层、中层特征构成的正负视图基础上,改进了SCFL的数据选择功能,在扩充训练集的同时有效地控制了融入学习的数据质量,从而以半监督的方式高效地检测出候选暴力镜头。经实验证明,该算法的正确率比有监督的SVM方法和传统的SCFL方法都有所提升。   ⑶提出了适宜应用需求的暴力相关事件检测算法。电影中的声音条件非常复杂,尤其在暴力场景中,各种声音的交错重叠使音频关键字检测很难达到令人满意的准确率。因此,基于音频底层特征,本文提出了侧重于将暴力相关事件与其他事件分开的算法,而不盲目追求单一暴力事件的检测效果。不仅利用了概率输出的SVM与融合时间信息的HMM模型,还计算了各事件与暴力的相关系数,从而由具体事件推断出镜头的暴力分值。   ⑷基于本文的层次模型,设计并实现了电影暴力内容检测系统。该系统可以随着电影的播放实时地检测镜头并显示当前的暴力程度值,赋予了用户直观的感官体验。
其他文献
当今时代,随着网络化和信息化的迅猛发展,云计算模式应用而生,其采用按需付费的方式为云用户提供轻便、可用的服务,并使云用户从繁重的资源维护中解脱出来。但是随着云计算应
网络安全随着互联网的兴起而产生,并随着互联网的发展而不断发展进步。在早期,人们通过对IP包的头部进行分析,发现网络流中的异常数据包,从而对IP包进行相应的处理。如今,随着网络
图像和视频中的文字包含丰富的语义信息,在很多应用中占有重要的位置,如自动标注,基于内容的图片或视频检索与分析等。由于图像和视频中的文字通常叠加在复杂的图像背景之上,现有
学位
无线传感器网络技术作为一个极具应用前景的技术,已经成为当前研究的热点。传感器节点是无线传感器网络最基本的构成元素,而运行在传感器节点的操作系统,能够有效地管理和使用有
随着面向服务计算技术的发展,互联网上Web服务的数量越来越多。面对数量众多的服务资源,如何有效地组织和管理这些服务成为了一个亟需解决的问题。分类是人们组织和管理大规模
随着网络存储系统的广泛应用,应用对其I/O性能也提出了越来越高的要求。蓝鲸集群文件系统(BWFS)采用带外数据传输的方法,分离元数据流和数据流,客户端直接访问存储设备,为应用提
作为一种计算机绘制方法,光线跟踪具有很多优点,可以比较真实、自然的模拟阴影、反射、折射等光照效果,但由于绘制速度较慢,一直没有在实时绘制中得到应用。不过,随着硬件水平的提
随着网络技术的发展,越来越多的网络服务提供商对外开放了可编程接口(API),允许用户通过API操纵分布在网络服务提供商上的数据。个人网格遵循以用户为中心的设计理念,它是支持个
美军标MIL-STD-1553B定义了一种数字时分制、命令/响应型、半双工的多路传输数据总线。该总线具有高可靠性和灵活性的特点,被广泛应用于航空航天电子系统以及一些对实时性和可
异构计算作为高性能计算领域的研究热点之一,近年来受到了广泛的关注。异构计算是指利用一组异构的计算资源共同协作完成某一项任务,这不但满足了不同类型的应用,也开发利用了系