基于MPEG-7颜色特征和语义的视频检索

来源 :华南农业大学 | 被引量 : 0次 | 上传用户:fby_1859
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的飞速发展和多媒体技术的广泛应用,越来越多的人使用网络上传多媒体信息,多媒体信息与日剧增。由于视频数据自身内容的特点即丰富性、多样性、结构的复杂性以及具有时空多维结构性,因此传统数据管理与检索方案不能很好地从巨大的视频数据源中找到所需要的信息,要想从这些海量多媒体数据中搜寻感兴趣的信息仍是一大挑战。   MPEG-7标准的目标是为了产生一种通用的多媒体数据内容描述接口,以满足对多媒体数据的管理和检索的需求。MPEG-7将确立各种类型的多媒体信息的描述方法,这种描述与内容密切相关,并支持对用户感兴趣材料的快速和高效的检索。因此,本文在分析研究了一些现有的基于内容的视频检索系统后,对MPEG-7标准的内容以及它与基于内容的视频检索之间的联系进行了介绍,并对视频内容规范描述及其检索方法进行了研究,建立通用的视频描述模式。并且在得到视频关键帧图像特征的基础上对MPEG-7主颜色描述符和语义描述符进行了深入的研究,主要的研究工作具体如下:   1.基于MPEG-7的视频内容描述本文首先对视频内容和MPEG-7中的多媒体描述模式(MDS)、描述定义语言(DDL)进行分析,在视频内容分析的基础之上,建立基于MPEG-7标准的视频内容描述模型。   2.分块加权主颜色及相关反馈的图像检索方法本文针对MPEG-7主体颜色描述符(DCD)无法反映色彩分布的空间信息这一缺陷,采用分块加权主体颜色,并在分块加权主体颜色的基础上,提出了相应的反馈方法,该反馈方法块间采用基于权重调整的关联反馈算法,块内采用调整主体颜色特征值的方法。   3.语义描述工具的设计与实现尽管MPEG专家组为MPEG-7标准提供了一整套语义内容描述工具,但并没有涉及这些语义信息如何检索,因此,本文基于MPEG-7语义描述方案实现可视化手工输入语义信息,并生成XML描述文件,基于生成的XML文件设计与实现基于语义信息检索。   4.基于MPEG-7的视频检索原型系统设计本文实现的视频内容检索系统除了能实现基于关键帧的语义层的检索和主颜色描述符的检索,还可以将关键帧中多种颜色描述符结合起来实现较为复杂的检索。本文设计的系统只是实现了部分功能,以后还应对视频检索的各关键技术进行更为深入的研究,以进一步完善和扩充系统功能并提高系统的性能。
其他文献
随着互联网技术的发展,电子商务、网络银行等网络交易活动也蓬勃发展;但随着网络交易活动的增加,使得这些活动在信息安全领域面临重大挑战。尤其是重要信息的传递和控制非常困
Web服务是一种分布式技术,是基于Web技术的最新成果,被称之为IT技术的第三次革命。Web服务是自包含、自描述及模块化的应用程序,其通过标准的Web协议使得不同平台的应用服务
近年来,随着Internet的快速普及,人们生活方式和认知世界的途径发生了翻天覆地的变化。由于互联网规模和覆盖面的迅速增长,人们主动或被动获取的信息也越来越多,同时,人们想
随着Internet的不断发展和Web服务技术的日益成熟,越来越多稳定、易用的Web服务共享在网络上,然而,单一的Web服务提供的功能毕竟有限,如要想定制、生成满足自身需求的业务,必
射频识别技术(RFID,Radio Frequency Identification)是利用射频原理通过非接触式双向通信方式来交换数据以识别目标的一项技术。随着RFID技术在军事领域、社会公共安全以及商
Internet网络传输和处理能力的大幅度提高以及音频和视频压缩技术的发展和成熟,使得网上音频、视频应用成为Internet上最重要的应用之一,出现了如视频点播、视频会议、远程学
近年来,随着多媒体网络通讯技术的飞速发展,图像和视频编解码技术已经成熟。但是现有的图像视频编解码方法只能以时间或空间为代价,获得解码质量的提升。因此如何以更小的代
利用静电悬浮结合落管来研究无容器微重力条件下材料的本征特性,是研究亚稳态新材料的重要手段。通过温度和图像传感器可测量样品体积和温度的变化,从而得到样品密度、比热、表
语音识别系统的性能是影响语音识别实用化的关键因素之一。语音训练数据的规模和质量对声学模型的性能有很大影响。在当今的信息化社会,大规模训练数据的获取越来越容易,但是
Flash是一种交互式矢量多媒体技术,由于它的短小精悍和跨平台性,使得它容易在互联网上传播,被广泛用于网页动画、互联网广告、网页游戏、视频网站的播放器等互联网应用。由于