论文部分内容阅读
石油作为国家重要战略资源,在国家经济与对外关系中具有特殊意义。面对既有空间信息又有属性信息的海量油气资源数据,传统的分析方法已不能满足从数据中获取知识的需求。因此,设计与开发油气资源数据挖掘系统具有理论与现实意义。本文首先介绍了数字油田与油气资源数据挖掘在国内外的研究现状,分析了石油行业数据增长的原因与空间数据挖掘的解决办法。根据油气资源的数据特点设计了油气资源数据挖掘的解决方案。根据现有盆地、油气田、井等数据的情况开展需求分析,随后对油气资源数据挖掘系统进行了详细的分析与设计,实现了基于B/S的具有四种挖掘方法的油气资源数据挖掘系统。探索性数据分析方法可以发现油气资源数据中非直观的数据特征及异常数据,并且选取感兴趣的油气资源数据,即数据聚焦,然后初步发现隐含的特征与规律。具体挖掘方法包括查询数据、相似性分析、空间数据探索分析、属性数据探索分析。查询数据使用空间查询与属性查询相结合的方法,通过构造查询条件从海量油气田中筛选符合研究人员所设定条件的数据。相似性分析通过感兴趣区域内各油气田与参考油气田属性特征的标准差值的等级来进行排序,找出与用户感兴趣的特征相似的油气田。通过计算油气田在空间分布上的数据中心与标准差椭圆,来发现油气田空间分布上的趋势与位置。属性数据探索分析利用储层、圈闭、盖层等属性统计来发现油气资源的特征规则,如最大值、最小值、均值、方差、众数等。空间统计分析方法包括了空间插值分析方法与空间聚类分析方法。空间数据聚类分析方法采用基于密度的DBSCAN算法,对用户感兴趣区域内的油气田进行聚类,发现具有高产能的油气田聚类,总结其空间区分规则。空间插值分析方法使用经验贝叶斯克里金插值算法,通过对已知油气田储层属性特征进行计算,预测未知油气田储层条件,并且了解其特征的空间分布情况。空间分布模式分析方法采用密度分析、Getis-OrdGi*热点分析、Anselin Local Moran’s I异常值分析来挖掘油气田数据在空间上的分布模式。密度分析通过对油气田在空间分布上的密度计算,可以得出空间上何处的油气田较为集中,何处的油气田较为分散,找出具有发展潜力的区域。热点分析与异常值分析用来统计识别油气田的属性特征在空间上具有统计显著性的热点与冷点以及异常值。可视化分析方法可以揭示油气资源数据的状况、内在本质及规律性。本次设计了统计图表可视化与专题地图可视化两种,考虑用户对油气数据属性值的不同表达需求,统计图表可视化主要包括柱状图、饼状图、条形图、折线图四种。专题地图可视化将空间数据挖掘结果直观地显示在地图上,一方面能够显示其知识特征的分布规律,另一方面也可对挖掘结果进行可视化解释,从而达到最佳的分析效果。利用ArcGIS API for JavaScript实现了油气资源数据挖掘系统,通过油气资源数据对四种空间数据挖掘方法进行了测试。结果显示,系统功能正常,测试结果与实际相符,系统达到了预期的效果。