论文部分内容阅读
随着信息技术和Internet的飞速发展,通过Internet上查找需要的信息越来越成为人们获取信息的重要手段之一。Internet中的信息数量巨大,并且以各种各样的方式存在。如何能够方便快捷的获取到想要的信息成为人们研究的重点。由此导致了搜索引擎的产生。搜索引擎技术经过10几年的发展,其能够处理文档的规模从最初的几千,万页增长到现在的几十亿页,并且能够支持不同的环境,能够用不同的语言进行检索。目前所说的搜索引擎一般都是指文本搜索引擎。这类搜索引擎的工作原理就是手工或者自动地处理来自Internet的文档,提取文档中包含的关键字或者将文档按照内容进行组织归类,用户通过关键字或者层层进入相应的类别查找到需要的信息。这类搜索引擎主要处理以文本格式存在的各种文档,对于Internet中日渐增多的多媒体内容信息的处理能力有限。无法提供人们按照多媒体信息的内容来查找到他们需要的多媒体信息。目前多媒体信息的数量急剧增加,如何有效的组织和查找这些多媒体信息是当前亟待解决的问题。
在这种情况下,国际标准化组织(ISO)着手组织制定了MPEG-7标准。MPEG-7是由MPEG(MovingPictureExpertsGroup移动图像专家组)继MPEG-1,MPEG-2和MPEG-4后制定的又一个国际标准。其正式名称是“多媒体内容描述接口”,目的在于为描述各种各样的多媒体信息提供一个统一标准。MPEG-7标准化了用于描述音视频信息的各种描述子,描述模式,用于创建新的描述模式和新的描述子,以及允许对已经存在的描述模式进行扩展和修改描述定义语言,还标准化了必要的系统工具。
本文首先着重介绍了MPEG-7的产生背景,它的目标及其各组成部分。MPEG-7标准化的几个部分包括系统,描述定义语言,多媒体描述模式,视觉和音频。详细介绍了视觉和音频的各个描述子和描述模式,同时也具体地介绍了多媒体描述模式的各个组成部分。接下来介绍了搜索引擎理论,包括搜索引擎的工作原理,面临的挑战以及发展方向。然后构建了一个基于MPEG-7的搜索引擎。讨论了搜索引擎的检索方式,检索方法和检索策略。规定了搜索引擎特征值的存储和客户端软件的基本功能。提出了搜索引擎的体系结构和各部分的功能。接着是搜索引擎系统的具体实现介绍。最后与文本方式的搜索引擎进行比较。在本文的末尾讨论了MPEG-7搜索引擎的应用价值和发展。