论文部分内容阅读
“石油工业是信息工业”,石油勘探开发通过大量数据掌握地下油气藏的储量和开采状况,石油勘探开发的生产、管理、科研和决策等业务活动都依赖于各类专业数据。数据需求驱动了数字油田的建设,使油田企业内部的数据资源急剧膨胀。这些数据以结构化或者非结构化的形式存在,蕴含了丰富的业务信息和空间信息,存储在分布、异构的数据源中。为加速数据资源的应用,提供方便、快捷地数据查找途径是油田企业数据管理的核心工作之一。
从空间的角度看,一方面石油勘探开发业务具有很强的空间性,具有空间信息获取的需求;另一方面石油勘探开发活动所产生的数据几乎都具有显式或者隐式的空间参考,具备了按照空间查找的条件。本文依据勘探开发业务人员按照空间维度进行信息获取的需求,挖掘油田数据的空间特征,综合文本相关性和空间相关性提高信息搜索效果,开展了油田空间信息搜索引擎关键技术的研究。
面向油田企业环境和勘探开发领域,本文从以下几个方面开展了相关技术的研究。
1、油田空间信息搜索引擎架构与检索模型研究。
提出了基于油田空间信息知识库的搜索引擎物理架构,研究了企业环境下异构信息采集模式、用户与搜索引擎的交互模式、协同搜索管理模式、信息安全控制模式,建立了油田空间信息搜索的“4+1”架构。针对石油勘探开发地质空间的多层性和旋回性,基于地层空间本体给出了垂向空间相似性模型,结合已有的地理信息检索模型和文本检索模型,建立了面向石油勘探开发的空间信息检索模型。
2、研究了油田空间信息知识库构建技术。
油田空间信息知识库是对用户查询空间感知和领域解释的基础,本文提出了基于模型驱动的空间信息知识库半自动构建方法。以Epicentre数据模型为源模型,通过建立UML元模型和OWL元模型间的映射关系,驱动石油勘探开发领域空间知识模型的生成;通过建立油田业务数据库模式与OWL知识模型的映射关系,驱动勘探开发空间概念实例的生成。
3、研究了面向文本-空间搜索的混合索引结构。
分析了主流文本索引和空间索引,综合考虑地质空间的多层性查询需求,提出了基于地层本体、R-tree索引和倒排索引的集成索引结构,地层本体用于垂向空间的文档定性索引;采用高效的R-tree建立水平空间索引;利用倒排文本索引建立关键词索引。采用真实数据集对所设计的结构进行了可用性测试。
4、研究了油田空间信息搜索可视化技术。
可视化帮助用户理解检索结果、把握检索方向,提高了勘探开发业务人员使用搜索引擎的效率。根据信息可视化的原理,信息可视化需要有可视化空间,提出了在地球空间、语义空间和应用空间对搜索相关对象可视化,实现了网络环境下基于2D/3DGIS的定量可视化、基于概念图的定性可视化和动态的企业应用服务集成与调用。
最后,以国内某石油公司为实际验证环境,基于油田空间信息搜索引擎“4+1”架构和检索模型,采用本文提出的空间信息知识库构建技术、索引技术、可视化技术,研发了石油勘探开发领域空间搜索引擎原型系统Petroscope,对本文所提出的相关技术进行了应用验证。