论文部分内容阅读
地学研究是典型的数据密集型研究,地学数据资源呈现海量、多源、异构的特征。如何克服地学数据资源的复杂性,高效、准确地获取研究主题相关的数据,是开展地学研究的重要前提。基于关键字匹配或全文检索技术的传统信息检索方式不能有效利用数据本身丰富的语义信息以及数据间的语义关联信息,更无法适应大数据背景下地学数据独特的复杂性,成为实现数据关联,智能推荐和精确发现的主要瓶颈,进而制约了地学研究的发展和数据的共享。 利用数据资源的概念语义关系以及本体的推理机制,构建基于本体的数据语义关联,提升检索反馈,是解决上述问题的有效途径。地学数据本体是地学数据共享概念模型的形式化规范表达,是实现数据语义关联的重要基础。形态特征是地学数据除时间、空间和属性等基本特征外的重要特征,形态本体即是地学数据本体的重要组成部分。因而论文开展地学数据形态本体及其应用研究,对于推进基于数据语义的地学数据精确发现具有重要意义。论文主要针对以下方面进行了深入的研究: (1)在系统分析地学数据形态特征的基础上,研究提出地学数据形态特征及形态本体的定义及内涵。从数据内在结构和外在形状两个方面概括形成了包含数据格式、数据结构、数据单位、空间基准等内容的地学数据形态本体概念体系。 (2)提出地学数据形态本体的五元组模型,并利用基于UML的建模方法对其进行形式化说明。研究本体的模块化构建方法,详细说明形态本体的构建内容和过程,并最终构建形成地学数据形态本体库。 (3)开展地学数据形态本体在数据关联中的应用,研究基于本体的数据关联流程,论述本体解析、存储管理和查询推理等关键技术。设计并研发了基于形态本体的地学数据关联系统,并对应用效果进行案例分析及评价。 综上所述,本文开展的地学数据形态本体及其在数据关联中的应用研究,实现了理论研究-概念模型-应用实践的一整套技术方法,对于进一步丰富地学数据本体,解决地学数据的语义关联和精确发现问题,具有一定的理论和应用价值。