论文部分内容阅读
随着输油管道越来越广泛的应用和信息技术的高速发展,泄漏检测数据出现了爆炸式增长,与此形成鲜明对比的是对海量诊断数据进行分析、处理和管理,以发现对管道泄漏决策有价值信息的方法却非常匮乏。本文以海量诊断数据优化处理与管理、数据挖掘技术为切入点,研究高效、精确、节省数据存储空间的海量诊断数据处理技术。
首先针对西部输油管道采集的压力数据,分析不同工况下压力波形、时域统计指标和幅值概率密度的特点,得到管道工况的有效判别指标。进一步研究压力数据时域特点,得出现场采集的压力值在变化前已经持续了一段时间,可以根据这个特点对压力数据进行时域抽样优化处理,对比几种抽样尺度对工况判别指标的影响,验证了抽样间隔较小时不影响工况判断,同时可以大量降低数据处理量。
应用数据挖掘技术处理海量的压力数据,通过大量数据样本应用C-均值模糊聚类得到各类工况的特征向量,并对现场实际采集的数据进行识别。设计适用于海量压力数据的双向链表数据结构,对比常规数据方法分析双向链表在数据分析、处理、存储和历史管理方面的优越性。同时着重研究了小波动数据处理和存储方法,提出了小波动数据定义和小波动数据时域优化处理方法。