基于内容的层次视频摘要生成技术研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:xiawei0018
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术和网络信息的飞速发展,数字视频信息的数量成指数级增长,如何对其进行有效的存储、管理和检索,成为目前亟待解决的问题。视频摘要是解决以上问题的一个途径,同时视频摘要也能辅助建立视频检索和索引系统。因此对于视频摘要的研究有着十分重要的意义。   本文在现有的视频摘要生成方法的基础上,提出在视频的镜头级和场景级建立层次视频摘要,以满足用户对视频内容不同信息粒度的需求,并对层次视频摘要生成的相关技术进行分析完善,提出自己的算法,开发出层次视频摘要原型系统。本文的主要工作包括:   (1)提出一种基于改进的k-means算法的关键帧提取方法。该方法在关键帧提取过程中,利用人工鱼群算法的自组织性对k-means进行改进优化。算法中首先采用人工鱼群算法依据特征向量进行自组织的聚类,得到k-means算法所需要的聚类个数以及初始聚类中心,然后执行k-means算法进行最终聚类,最后提取出距离每个聚类中心最近的帧作为关键帧。将提取出的关键帧按序输出,得到细粒度的镜头级视频摘要。该方法可克服传统聚类算法中需要先验知识指定初始聚类数,初始聚类中心随机性选择带来的不稳定性及容易陷入局部极值的问题。   (2)提出一种基于镜头多特征融合的场景分割方法。在镜头相似度衡量中,综合考虑镜头的颜色特征、空间结构特征和镜头的运动特征,以提高场景检测的准确性。并通过双滑动窗口聚类算法将时间相近,内容相似的镜头聚集到同一场景中,在双滑动窗口聚类算法中,采用半自动的方法进行镜头相似度阈值的选取,避免了经验值的设定。   (3)提出一种基于代表镜头的场景摘要生成方法。为保证场景摘要的内容完整丰富,可以吸引用户注意力,分别计算场景中每个镜头的时空域显著度和镜头的持续度,通过加权求和得到每个镜头的重要度,选取镜头重要度高的几个镜头作为该场景的代表镜头,选取代表镜头的关键帧作为场景代表帧,将场景代表帧按照时序排列输出,生成基于场景的粗粒度视频摘要。   (4)采用面向对象的思想对系统进行分析设计,运用UML建模语言对系统架构进行建模,实现层次视频摘要原型系统。该系统由镜头级视频摘要生成、场景检测及场景摘要生成等功能模块组成,其中镜头级视频摘要生成包含镜头分割、关键帧提取两个部分。该系统对本文提出方法的效果进行了验证。
其他文献
最近几年,嵌入式技术在集成电路大规模发展的带动下发展迅速,在工业控制、智能控制、医疗、电子等方面都发挥着重要的作用。近年来,嵌入式产品在医疗卫生方面的应用日渐广泛
图像噪声去除是图像恢复的主要内容之一,其主要任务是去除所观测到图像的噪声部分,从而得到理想的图像。近年来,基于变分方法的图像扩散技术成为图像去噪的主流方法之一。该
隐私保护是数据挖掘领域中一个重要的研究课题,其目标是在不泄露隐私信息的前提下,获得精确的挖掘结果。数据挖掘中的隐私保护通常有两种解决途径:安全多方计算和数据扰乱。
实时、准确的获取各种交通参数,是智能交通管理的前提。视频监控方法是通过分析拍摄的交通图像序列,对交通目标进行检测、识别和跟踪,并对其行为进行分析和判断。与其它检测
计算机网络的普及,使得针对互联网衍生的应用程序越来越多。同时随着电子商务与P2P (Peer-to-Peer)网络的出现,使网络用户对网络的安全性以及带宽需求提出了更高的要求。自20
无线移动设备的大量使用和普及,使容迟网络(Delay Tolerant Networks, DTN)成为目前无线网络应用研究的热点。这种靠移动设备自组织成的网络,其拓扑结构随着节点的高速移动不断
研究无线传感器网络一个重要目的就是在满足网络应用需求和保证数据通信安全的前提下,尽可能地延长整个网络的生命周期。在以分簇方式组织的传感器网络中,靠近基站的节点因转
数字视频属于国家重点发展的信息产业领域,随着宽带网络和数字电视的迅速发展,视频点播、交互电视、视频网站等应用需求将越来越广泛,这些应用都将共同面临大量涌现的数字化
聚类是数据挖掘的一个重要研究问题,它可以有效地帮助我们分析数据的分布、研究数据的特征、寻找隐藏在数据中的结构,以便作进一步分析和利用。聚类边界代表着那些归属明确,
随着Internet的发展,一种面向服务的企业应用体系架构(Service‐Oriented Architecture)SOA应运而生。伴随而之,面向服务的软件也成为引领Internet的主流软件。然而,面向服务的