论文部分内容阅读
近年来,由于物联网的不断普及、物联网传感器设备的不断增加,表征观测对象行为模式的时间序列数据大量产生,将数据挖掘技术应用到物联网的时间序列分析,从而挖掘表征数据中隐含的高阶状态和模式行为成为当下十分热门的一个课题。基于机器学习模型的时间序列挖掘方法能够很好的揭示序列内在的工作规律,能够应用于工业设备的工作模式挖掘,为大型工业设备的维护提供决策依据。本文面向工业设备故障诊断与剩余寿命预测等应用需求,基于隐马尔科夫模型(Hidden Markov Model,HMM),结合时间序列数据的时间依赖特性,对基于HMM的时间序列数据挖掘经典算法进行了研究探索,并在传统HMM的基础上,提出了一种基于聚类结果的HMM模型(CHMM)应用于时间序列的挖掘。该模型首先通过聚类的方式对原始时间序列进行特征提取,并将聚类得到的结果作为初始的观测序列使用。其次,通过扩展型Viterbi算法与迭代模型同时学习得到最优的观测和隐状态序列,揭示序列内在的工作规律。为进一步分析预测工业设备的故障和剩余寿命,本文在获得系统隐状态的基础上,提出一种基于隐状态的HMM诊断与预测模型(State-based Hidden Markov Model for Fault Diagnostics and Prognostics,SHMM-DP)。此模型根据CHMM模型中获取的隐状态信息,一是对隐状态信息建立诊断规则,并将一个具有预定义本体的组合规则集作为知识库使用,从而能够对当前序列表征的工业设备可能存在的故障进行推理,获得故障根本原因。二是通过Baum-Welch算法对各状态进行HMM建模,通过比较当前序列在各状态HMM模型上的对数似然概率大小,由多元线性回归模型得到设备剩余寿命序列与对数似然概率序列之间的线性关系,预测当前设备的剩余寿命。实验结论表明:CHMM模型能够有效地发现系统隐状态,并且在初始聚类方法的选择上,空间聚类对比于K-means聚类式拥有更好的聚类效果。在此基础上,SHMM-DP对于系统剩余寿命的预测是较为准确的性能,可应用于飞机引擎的预测性维护场景。