油气勘探开发领域文本知识抽取和可视化

来源 :中国石油大学(北京) | 被引量 : 0次 | 上传用户:liuqingsong835200
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着知识工程的快速发展以及石油行业数字化的推进,用知识的方式管理油气勘探开发成果和相关文献逐渐成为数字化油田建设的重点。为了方便利用前人勘探开发经验,有效的管理和分享油气勘探开发领域知识,需要引入文本知识抽取和知识可视化技术。在研究油气勘探开发领域文献特点的基础上,利用自然语言处理技术,结合统计学方法来对领域文献进行语义信息知识抽取。首先是相关词典的构建,包括油气勘探开发领域专业词典以及涵盖领域中常用谓语的谓语词典;之后对pdf、doc、ppt等不同格式文档进行统一格式转换,减少存储空间,方便统一处理;按照文档摘要、关键字、各级标题等要素对文档结构进行分析,使用Map进行存储;利用统计学方法,结合词语词性,位置等参数对词语和句子进行加权,抽取关键词和句子;经过分词和词性标注后,利用词性规则进行短语识别;最后根据建立的语义信息抽取模板实现语义信息的抽取。在勘探开发领域知识可视化方面,对建立的领域本体模型和过程模型,利用Flex富客户端技术,分别使用本体形式化描述、本体树状模型和本体网状模型等方式进行描述和可视化。实践证明这种方法在石油勘探开发知识领域中的应用有一定价值。  
其他文献
学位
在科学数据处理中,数据采集是很重要,但却不被人重视的一环。IT行业的数据大多由软件系统自身产生,数据采集不是问题。但是在非IT行业的科学研究中,科学家们经常需要从社会生活或
高性能计算是国家高科技发展战略的关键组成部分,研制具有中国自主知识产权的高性能计算机对提升我国综合国力具有重要意义。高性能计算机中CC-NUIVlA系统结点内部可以实现资
学位
随着社会网络、移动应用以及传感器技术的发展和普及,数据收集的效率、规模和种类得到了很大的提高,催生了对非结构化数据的管理。由于开放环境下的非结构化数据具有海量、异构
随着计算机科学技术的迅速发展,人脸识别技术已经取得了许多重大的研究成果和突破性的技术,但是人脸识别依然是一项比较艰难的课题。人脸图像在采集过程中容易受到复杂环境的影
学术社交网络(Academic Social Networks)是学者用户在线学术交流的网络平台,学者可以方便的在该平台上和其他学者建立好友关系,发布学术动态,分享和评论其他学者的学术动态信息。
随着互联网技术在全球的广泛使用和移动互联网技术的快速发展,大数据时代迅速到来。信息采集和发布技术日益丰富带来了数据爆炸,互联网和智能终端用户的快速增加带来了数据需求
光学显微镜有着一个共同的缺陷:放大倍数越大,其景深越小。在生物医学或者刑侦领域使用的光学显微镜,其景深的数量级通常是10-3m或者更小,这就造成了一个现象:当被观察的物体表
网格计算是科学计算领域的热点问题,其目的是将地理位置上分布各地的各种计算资源、存储资源汇聚起来,实现资源的共享和协同操作。网格内部资源的高效利用关键的因素在于用户提