【摘 要】
:
时间序列异常是指时间序列上下文中与正常模式存在差异的子序列,从大量时序数据中识别该子序列的过程被称为时间序列异常检测。随着时间序列异常检测技术的广泛应用,其存在的挑战性问题也逐渐被领域专家所关注。例如,噪声干扰、序列维度间相互作用、数据庞大且难以完全标注。针对上述三个方面存在的问题,本文基于变分自编码器(Variational Auto-Encoder,VAE)技术对多维时间序列异常检测问题进行研
论文部分内容阅读
时间序列异常是指时间序列上下文中与正常模式存在差异的子序列,从大量时序数据中识别该子序列的过程被称为时间序列异常检测。随着时间序列异常检测技术的广泛应用,其存在的挑战性问题也逐渐被领域专家所关注。例如,噪声干扰、序列维度间相互作用、数据庞大且难以完全标注。针对上述三个方面存在的问题,本文基于变分自编码器(Variational Auto-Encoder,VAE)技术对多维时间序列异常检测问题进行研究,具体包括三个方面的内容:(1)基于自编码器的USAD(Un Supervised Anomaly Detection on Multivariate Time Series)算法,采用对抗网络结构实现无监督或半监督的微小异常模式识别,成为目前时间序列异常检测领域的基线算法。但是它存在多维数据特征表达能力弱、对噪声数据较敏感的问题。本文针对USAD算法进行改进,提出一种基于变分自编码器的多维时间序列异常检测算法(SPD-VAE算法)。首先,引入对称正定矩阵(Symmetric Positive Definite matrix,SPD)的概念,通过计算协方差矩阵(Covariance Matrix,CM)对高维非线性空间进行特征抽取,提升模型对复杂数据分布的表达能力。其次,在USAD算法的基础上,使用变分自编码器代替自编码器结构,并将单位高斯噪声添加到隐藏层中,在对抗网络结构的基础上通过定义损失函数提高模型的抗干扰能力。最后,在矿井NEW数据集、SWAT数据集和WADI数据集三个真实数据集上以Precision、Recall、F1值三个评价指标进行对比实验。得到的实验结论为:SPD-VAE算法在两个数据集的决定性评价指标F1值上取得了最高的异常检测精度,与USAD算法相比分别提升2.0%和5.2%,在三个数据集上总体上性能最优,结果验证了本文算法的有效性。(2)单体异常检测算法大都专注于特定领域内的异常模式进行识别,泛化能力弱,同时存在收敛于局部最优解、抗噪性差等问题。本文结合Stacking集成学习方法的思想,提出一种多维时间序列异常检测集成算法(SPD-VAE Ensemble,SVAE-Ensemble算法)。一方面,采用Stacking集成学习方法结合不同类型的学习器来提升模型性能,解决异常检测结果收敛于局部最优解的问题。另一方面,采用投票法解决单体异常检测算法泛化能力弱的问题,提升模型对不同类型异常模式的检测精度。特别的,选择本文提出的SPD-VAE算法作为基学习器,提高算法抗噪声能力。实验部分,选取矿井NEW数据集、SWAT数据集和WADI数据集,对所提方法的效果进行验证,对比实验表明,提出的集成学习方法相比其他算法在三个真实数据集上都取得了最高的异常检测精度,与没有集成优化的SPD-VAE算法相比,F1值分别提升1.9%,2.8%,2.2%。(3)在本文研究成果的基础上,设计并实现了一个矿井安全监测数据异常检测原型系统。首先,系统可以采集传感器监测数据,并对监测数据进行处理。接着,对基于VAE时间序列异常检测集成模型进行训练。最后,对异常进行检测与结果展示,方便相关人员进行日志管理维护。
其他文献
法国、日本和美国的殖民统治是激发越南民族主义形成的外部力量,以儒教为代表的传统文化和文字的统一成为其民族主义形成的“内聚力”及推手,在此过程中越南民族精英则发挥了引领作用。在民族主义促使下,胡志明提出“越南民族是一个整体”,为了迎合这一口号,越南史学界提出民族起源的“本土”说以凸显历史的独特性和自发性,将历史上中越关系构建为“侵略”与“反侵略”以强化民众对国家的认同意识,在民族历史书写中彰显越南古
多元时间序列作为一种常见的数据储存形式,广泛存在于现实世界各个领域的复杂系统中并得到大量分析应用。而实际获取的多元数据可能存在的冗余、无关变量或数据不完整等问题,往往不利于进一步的建模分析与应用。因此对多元数据做特征提取建模、对不完整数据做缺失值填充处理具有重要的现实意义。本文以多元时间序列数据为研究对象,以变分自编码器模型(Variational Auto-Encoders,VAE)为研究方法,
《民法典》第549条第2项确立的关联债权抵销亦属基础合同产生的抗辩,债权的受让人或扣押人不能要求债务人给付而不承受该抗辩;同一合同项下给付和对待给付之间的对价均衡应得到尊重,而无论某一债权被让与抑或被扣押。关联债权抵销蕴含的同时履行抗辩机制,接续债权之折抵,导致其相比法定抵销在抵销权提起、法效果方面存在若干特色。“关联性”不仅存在于双务合同之中,还可在双务关系、构成同一交易的数个合同中得到肯认。因
阅读不仅是基本的语言输入方式,而且是人们学习英语的重要途经之一。元认知策略作为学习策略的重要组成部分,是对学习活动的计划、学习过程的监控以及学习结果的评价。相关研究表明,在阅读中学生元认知策略的使用情况会影响其阅读理解文章的能力。因此,对中学生元认知策略在英语阅读中的应用情况展开研究显得尤为重要。作者以新乡市第十初级中学初二年级6个普通班258名学生作为研究对象,首先采用问卷调查法对学生元认知策略
元认知概念是由国外学者Flavell在1979年提出的,是个体对自身认知活动过程的监测和调整。元认知能够监控和协调个体的各种认知活动,可帮助学生发展认知思维,培养学生的学习能力。基于此,本研究首先开展高中生地理元认知能力发展水平现状调查与分析;然后基于元认知理论和高中生元认知能力现状调查分析结果,提出高中生地理元认知能力发展的培养方案设计;最后,将提出的元认知培养方案运用于地理教学实践中,并对实践
“合理膳食行动”是《健康中国行动(2019-2030年)》所明确指出的重大行动之一,满足高校营养餐食供给需求是保障大学生合理营养、平衡膳食的物质条件基础,本研究旨在为高校营养餐食供给侧改革优化提供理论参考依据。本研究运用多层次模糊综合评价法、A型图解法、指标序号法等方法,对2019年后中国政府官方新闻机构通讯刊物所报道的6所提供“轻食营养餐”院校的大学生用餐满意度进行测评,结果显示大学生群体的高校
传统的推荐方法利用用户-项目评分矩阵来计算相似度,进行推荐任务,但由于不能充分地利用用户-项目信息,会使得推荐效果不佳。基于此提出融合复杂先验与注意力机制的变分自动编码器推荐算法,将变分自动编码器模型与推荐方法相结合的方法,不仅能够学习用户和项目的潜在特征,还能够将高维稀疏的用户-项目矩阵压缩成低维稠密矩阵。首先,用多层神经网络生成的隐向量先验分布替代标准正态分布作为假设先验分布,让模型能够获得更