基于语义标注的搜索引擎系统的研究与实现

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:zhangfalun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统搜索引擎技术是基于关键词字符匹配的全文检索技术,主要借助目录、索引和关键词等方法来实现。由于提交的查询语句存在歧义性和不明确性,因此返回给用户的搜索集合中往往存在大量跟用户检索词主题无关的文档,导致返回给用户的检索结果并非用户需要的资源,查全率和准确率都太低。  因此,在这样的背景下,针对目前搜索引擎中存在的问题,本文研究的主要内容如下:  第一,本文研究一种基于语义标注的搜索引擎解决方案,即基于本体技术对检索资源进行语义标注,将标注的状态从机器可读转化到机器可理解。机器可理解的语义是通过用本体对数据进行定义、用标准的RDF或OWL语言进行表示、并用逻辑推理的方式进行处理来实现的。之后基于这种已经标注过的资源建立一个全文语义搜索引擎。从而能获取与用户提交的原查询关键词具有语义关系的文本资源,返回给用户的检索结果也更加贴近于用户原本的真实含义。  第二,基于这种应用,本文提出了一个由资源搜集模块、语义描述模块、语义标注模块语义推理模块、语义检索/输出模块构成的一个基于语义标注的软件工程领域语义搜索引擎原型系统。
其他文献
本文首先系统地介绍了国内外关于本体论知识的不同见解和观点,主要涉及本体论的概念、类型、作用、结构、构造原则、开发方法及其应用研究等,尤其指出了其在相关领域中在知识表
随着芯片集成度的不断提高,功能验证已成为集成电路设计流程中时间耗费最大的环节,尽早且快速地发现集成电路设计中的错误,对于缩短验证周期具有重要意义。目前,功能验证方法主要
在信息网络技术不断发展的今天,融合网络已经成为当前最活跃,最具创新性的领域之一。网络的融合使得原有电信服务的种类和内涵都有了新的扩展,具有异构网络智能协作,资源共享
随着计算机软硬件的发展以及应用水平的提高,事件流应用越来越多的出现在网络安全、金融分析、传感器网络等领域中。目前已用于国家网络安全监控应用的DBroker系统作为一种基
随着信息技术的快速发展,人们收集、存储和传输数据的能力不断提高,各类应用领域产生海量的数据,数据挖掘与机器学习成为了数据分析和知识发现的重要工具。频繁模式挖掘是数据挖
在模式识别、机器学习以及数据挖掘中,分类是一个基本而又重要的问题。作为模式分类的研究方法之一的支持向量机技术近来也得到广泛的研究和应用。进行分类时,我们必备的两个
由于互联网的优越特性,在其上发布信息极为便捷,这就使得互联网上的信息数量以近乎爆炸的速度增长。如此多的信息即使浏览一遍都无法做到,用户希望能找到感兴趣的部分更是不
人脸识别作为最自然、最友好的生物特征识别方法,在安全、金融等领域均有重要的应用价值。经过近四十年的发展,传统二维人脸识别在限定性条件下已经获得很大进步,但在光照、姿态
聚类分析作为数据挖掘的重要技术,在网络分析、市场营销以及医学图像自动监测等领域被广泛应用。聚类就是将物理或者抽象的集合分组成为由类似对象组成的多个类的过程,同一个
自然场景的动态模拟一直是虚拟现实和计算机图形学中一个重要的研究领域,它在计算机动画、影视制作、虚拟现实、三维数字展示和战场模拟方面都有非常广泛的应用。风作为自然