构建基于MPEG-7的搜索引擎

来源 :南京大学 | 被引量 : 0次 | 上传用户:UserReg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和Internet的飞速发展,通过Internet上查找需要的信息越来越成为人们获取信息的重要手段之一。Internet中的信息数量巨大,并且以各种各样的方式存在。如何能够方便快捷的获取到想要的信息成为人们研究的重点。由此导致了搜索引擎的产生。搜索引擎技术经过10几年的发展,其能够处理文档的规模从最初的几千,万页增长到现在的几十亿页,并且能够支持不同的环境,能够用不同的语言进行检索。目前所说的搜索引擎一般都是指文本搜索引擎。这类搜索引擎的工作原理就是手工或者自动地处理来自Internet的文档,提取文档中包含的关键字或者将文档按照内容进行组织归类,用户通过关键字或者层层进入相应的类别查找到需要的信息。这类搜索引擎主要处理以文本格式存在的各种文档,对于Internet中日渐增多的多媒体内容信息的处理能力有限。无法提供人们按照多媒体信息的内容来查找到他们需要的多媒体信息。目前多媒体信息的数量急剧增加,如何有效的组织和查找这些多媒体信息是当前亟待解决的问题。 在这种情况下,国际标准化组织(ISO)着手组织制定了MPEG-7标准。MPEG-7是由MPEG(MovingPictureExpertsGroup移动图像专家组)继MPEG-1,MPEG-2和MPEG-4后制定的又一个国际标准。其正式名称是“多媒体内容描述接口”,目的在于为描述各种各样的多媒体信息提供一个统一标准。MPEG-7标准化了用于描述音视频信息的各种描述子,描述模式,用于创建新的描述模式和新的描述子,以及允许对已经存在的描述模式进行扩展和修改描述定义语言,还标准化了必要的系统工具。 本文首先着重介绍了MPEG-7的产生背景,它的目标及其各组成部分。MPEG-7标准化的几个部分包括系统,描述定义语言,多媒体描述模式,视觉和音频。详细介绍了视觉和音频的各个描述子和描述模式,同时也具体地介绍了多媒体描述模式的各个组成部分。接下来介绍了搜索引擎理论,包括搜索引擎的工作原理,面临的挑战以及发展方向。然后构建了一个基于MPEG-7的搜索引擎。讨论了搜索引擎的检索方式,检索方法和检索策略。规定了搜索引擎特征值的存储和客户端软件的基本功能。提出了搜索引擎的体系结构和各部分的功能。接着是搜索引擎系统的具体实现介绍。最后与文本方式的搜索引擎进行比较。在本文的末尾讨论了MPEG-7搜索引擎的应用价值和发展。
其他文献
IEEE 1394协议是在由多媒体系统和设备组成的网络中传输多媒体数据的一个总线协议.该协议具有很好的可扩展性,各种设备可以随时加入到网络中来,或者随时从网络中拔出.协议本
我提出了一个基于XML的教育资源搜索引擎.该系统专门针对教育资源站点进行搜索,对使用者提供教育资源的搜索服务.利用该系统用户可以快速而准确的搜索教育资源库中的资源,包
该文将主动形状模型(ASM)技术用于头影标志点和结构的自动识别.并针对ASM算法中的问题,提出了若干改进方案.第一,实现基本ASM算法,并用于头影识别.ASM算法是一个形状统计模型
随着企业需求的不断扩展以及网络技术的迅猛发展,企业应用开发变得越来越慎重,越来越复杂。为了能够在竞争中处于有利的地位,采用合理的企业应用架构和新技术就成为企业能否有效
该文重点研究了基于OP通道的人-人交互与协作系统的协调机制及其协调功能.在描述系统模型的基础上,分析了系统对协调功能的需求,提出了通用的形式化协调模型,给出了系统的协
随着科学技术的发展,人们迎来了数字时代,许多产品都建立在电子信息的基础上表达,数字技术使得产品变得极大丰富,也使它们的存储、复制和传播变得简洁快速,而这也导致了数字
随着互联网的迅猛发展,网络安全问题和计算机犯罪也呈现愈来愈严峻的趋势。据统计表明,绝大多数的网络安全问题都是由系统漏洞、软件漏洞或者web漏洞所引起。利用漏洞或各种
变异情况对语音的影响是导致语音识别系统性能下降的原因之一.一般情况下变异语音数据采集困难,获得的训练数据量少,这样即使测试环境和训练环境都相同,识别性能也不理想.利
球形运动装置是一种将所有元件封装在一个封闭的球壳中的机器人,外观呈球形。球形运动装置具有全方位运动、转弯半径理论为零、占地空间小、运动摩擦力小、内部装置不受外界干
该文提出了一种本体驱动的信息提取方法,用于处理Web上的大规模的真实的无结构文本.该研究引入了浅层自然语言处理技术用于对文本进行语法分析,既是信息提取的基础,又提供了