基于领域本体的语义搜索研究

来源 :华南师范大学 | 被引量 : 0次 | 上传用户:itsmoreaaron
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前流行的信息搜索方法大都基于关键字的匹配,尽管已经出现了赋予文档、查询语句语义含义的检索模型,但这些模型本质上是从句形相关度的匹配转变为词汇语义相关度的匹配。由于现存本体差异性大,定义的语义质量参差不齐,且缺乏一种高效的知识发现、常识推理的机制,使得根据用户的真正意图进行语义搜索变得困难。本文以搜索计算机领域的科技论文为例,提出一个新颖的基于计算机领域本体的语义搜索方法。结合语义网的相关技术,用计算机领域本体表示文档中的知识,用求带权最短路径的方法扩展查询,推断出用户的真正意图,在搜索过程中,综合考虑句形和语义两种因素进行匹配查询,根据语义相似度排序相关文档。通过标准的固定数据集Cora测试证明,此模型能有效地提高查询准确率。本文的主要贡献如下:   (1)结合WordNet通用本体和ACMCSS构造计算机领域本体,以及文档和查询语句中的概念及语义实体关系,提供一个共享的和统一的语义内容理解,从而实现对文档集的语义搜索。   (2)提取查询的语义特征,对自然语言的查询语句进行分析,在搜索过程中,选择最短路径上的概念更全面地了解查询意图。此外,所提出的方法可以处理与基于关键字和基于语句的查询,使得语义搜索更方便,更人性化。   (3)采用高效的文档匹配排序方法。沿用传统的向量匹配方法,通过扩展语义网络掘出更多隐藏的、相关的语义信息,在查准率有所提升的情况下,保证其查全率的水平,使得整体的检索效率上升。
其他文献
随着信息科学技术的发展,虚拟现实系统中的数据量和计算量正在呈爆炸式增长,传统的依靠本地文件系统和私有协议存储、管理和分发数据的方式已经难以满足快速增长的用户需求。因
在计算机网络高度繁荣的今天,众多的计算机恶意程序时刻威胁着计算机安全。近年来许多已知恶意程序以新变种的方式死灰复燃,而完全未知的恶意程序利用传统恶意程序检测方法响应
随着计算机技术在行业应用中的不断深入,数据库技术和时态信息技术不断获得发展的动力。技术的关注点已从过去的信息记录处理逐步延伸到信息的有效性和时间性。特别是在电信、
近几年来,移动互联网技术和应用快速发展,移动多媒体服务随着智能手机的普及而日益成为人们的新需求。同时,显示技术的不断进步使得智能手机能够支持高清甚至是超高清视频的显示
选举问题主要研究各种不同的选举规则可能带来的不同结果,它是社会选择理论中的一个重要研究方向。在选举理论中,孔多塞提出了用配对的比较结果来描述基于锦标赛形式的选举,并将
随着互联网的迅猛发展,网页的信息量呈指数型增长,逐页浏览信息已经不能满足人们的要求,信息抽取技术应运而生。信息抽取技术使人们不用进一步人工筛选符合自己需求的内容而
随着现代教育技术和教育信息化的深入发展,教学资源库在现代教育中发挥着越来越重要的作用,已成为新一代校园数字化建设的核心,建设优质、高效的专业教学资源库对于高职院校的专
随着信息技术的进步和飞速发展,各类软件己成为生产力发展和文明进步的强大动力和支撑。如何构建高质量、低风险、可预期、可掌控的可信软件则越来越为人们所重视。围绕“软
作为一种新的软件范型,网构软件所面临的一个关键挑战来自于开放、动态和多变的网络环境所带来的负载动态性。在动态、多变的Internet环境中,用户的行为难以预测,其具体表现为用
云计算作为一种新的计算模式越来越受欢迎,它有效地通过互联网整合大规模计算资源、存储资源,并把这些资源虚拟化,以服务的形式按需提供给用户。云存储是近年来随着云计算的发展