论文部分内容阅读
摘要:调控一体化模式监控员需要面对海量监控告警数据。调控系统需要有效滤除“噪声”,提取有效信息,提高监控员判断的准确度。应用专家系统等方法对明显的“噪声”信号进行了处理,在使用Apriori算法对历史告警数据挖掘后,通过研究标签传播算法(label propagation algorithm LPA)对告警信号的相关性进行分析,并取得了一定成果。提出了一种基于“标签”的告警信号预测方式,为需要重视的告警信号进行标记,同时应用信号和设备的关联建模指向一次设备本身,以引导监控员更好地完成工作。
关键词:告警窗;标签传播算法;Apriori算法;调控一体
中图分类号:TK21 文献标识码:A 文章编号:1007-0079(2014)35-0211-03
随着国家电网公司“三集五大”[1,2]建设的深入开展,作为公司核心业务之一的“大运行”体系提出了“调度集控专业融合、调度结构优化调整”的改革方向,这就需要整合多级电网调度和变电运行资源,推进变电设备集中监控业务与电网调度运行业务的融合,实现各级调控一体化,以提高驾驭大电网的调控能力和大范围优化配置资源的能力,保障大电网的安全、经济、优质、高效运行。根据业务分工不同,监控员主要负责对设备状态监视,但海量的设备状态信号对于监控员来说并不友好,同时充斥着大量“噪声“严重影响监控员的判断。作为电网运行的重要要素,一次设备的运行状况会直接影响整个电网的安全,由于设备本身的问题造成电网故障的案例在国内外屡见不鲜。
目前在实际运用中针对监控信号的过滤、优化有延时告警、频发告警抑制等方法。这些方法对于告警信息使用经验数据来过滤多余的频发告警信息,从某种程度上讲,有效抑制了“噪声”告警信息,但“一刀切”的监控方式,对某些可能是正常频发的故障信号造成误伤,或者是某些设备异常状况却无法被监控员及时发现,耽误了最佳处理时机。与此同时,由于信号本身缺乏关联性,导致监视重点很难突出。目前调控一体系统普遍采用的策略是告警分等级[3]的方式,即在系统建设初期就将信号点按照重要程度顺序分级,监控员只需要重点关注最高等级的告警即可。从实践来讲,该方法简单有效,某种程度上固化了信号的含义,虽然能及时发现问题,但忽视了信号间的关联性,无法及时将设备故障解决在问题发生之初,从而降低了设备在电网中的故障运行风险。
本文通过分析监控员的日常使用习惯及信号特征,实现了一种较为实用的“噪声”消除方法,在目前普遍应用的五级告警分级基础上提出了一种结合“推荐系统”“频繁项”、[4,5]人工“标签”的数据挖掘算法,在设备出现异常的初期及时提醒监控员重视,通过灵活的变化确保告警,避免事故扩大化,进而控制事故蔓延。
一、调控一体化应用及调控告警信息简介
调控一体化应用(即:采用电网调度监控中心加运维操作站的管理模式),具体而言,就是电网调度与变电监控一体化设置,变电站运行管理机构分片布点。调度控制中心主要承担电网调度、变电站监控及特殊情况下紧急遥控操作等职责;运维操作站主要负责调度指令的分解、变电站刀闸操作、运行巡视等工作。
随着调度、监控业务合并到主站端,一方面解决了设备安全运行和电网安全运行的及时信息互通,合多人之力共同解决问题;另一方面由于监控员面对的监控对象由过去的某一个变电站转变为本电网公司辖区下的所有变电站,需要监视的信号数量呈几何级增加,但由于技术不成熟等多种原因造成的信号质量不佳,大幅增加了信号数量。如果对告警进行处理缺乏有效手段,那么监控对于维护电网安全运行的功效将大打折扣。
集中监控的监控员在日常工作中按责任区划分对电网公司管辖范围内的厂站分区、划片进行监视,通常的监视手段为实时告警窗和光字间隔图。综上所述,在电网,设备平稳运行的阶段,基于现在的分类方式,任何一种风格的告警窗都可以很好的配合监控员工作。但是一旦出现电网波动或是设备故障,抑或是信号误发,对于调度端来说,都会有海量信号涌入,因此,研发出一种合理的信号关联处理方法十分必要。
二、理论依据
1.现状分析
调控一体应用采用了一二次模型建模的方法,将二次设备产生的保护信号和一次设备进行了关联。各个孤立的保护信号通过一次设备建立了关联,部分无法对应到唯一的一次设备的保护信号则通过间隔进行关联,而一次设备通过拓扑建立关联关系,如图1所示为简化的设备、间隔、信号模型。[7]
目前国家电网公司对信号进行了五级分级,即一类为事故、二类为异常、三类为越限、四类为变位、五类为告知。通常一类信号产生意味着电网中已经出现了严重的事故,这类信号往往最少,而其他几类信号普遍较多,并且往往蕴含着电网事故发展的趋势,但是由于数量巨大,有用的信息经常被淹没在频繁的动作信息之中。
2.标签传播算法
标签传播算法label propagation algorithm(LPA)[6]是一种基于图的半监督学习方法,其基本思路是用已标记节点的标签信息区预测未标记节点的标签信息。利用样本间的关系建立关系完全图模型,在完全图中,节点包括已标注的和未标注的数据,节点之间的边则表示两个节点之间存在的关联关系,节点的标签按相似度传递给其他节点。
目前在社交网络分析领域中,标签传播算法被广泛采用,该算法主要用来自动挖掘社交关系中的“团结构”(通俗讲就是不同的圈子)。该算法能够广泛使用主要因为它有两个明显优点:首先,该算法思路非常直观易监测、易理解、易实现;其次,该算法机制易于实现对大规模数据处理,具有很强的实用性。对比与电网中的二次信号,两者之间的不同处在于社交网络的信息更具随机性和随意性。作为调控一体应用来说,电网中的信号则更具有规律性;两者的相同性在于针对任何一个电网设备,或是整个电网都类似于社交网络均可以将信号(包括开关信号)和设备、电网建立网络关联,进而结合信号的产生推测出信号状态在电网或是某一设备的传播,通过人工指定的某些一类事故信号,提前提醒监控员重视某些非一类信号,及早发现电网设备的事故隐患。 对一个电网络E来说,将电气设备抽象为节点,那么电网络包含若干个节点,节点之间由边相互连接。这足够抽象为一个图的结构,考察其电气属性,节点之间相互连接代表两个设备之间相互连通,那么某设备的某一信号出现异常,那么故障会首先在设备内部开始发展,如果没有保护装置的及时切除,持续发展下去就会导致整个电网出现严重故障。
对于电网E来说,应用标签传播算法自动发现其中的密集连通子图,在初始阶段可以为图中每个节点赋予一个独一无二的标签L,这个标签即为节点的初始标签值。接下来通过多轮迭代计算,通过图的边将标签向其他节点传播。在一轮迭代运算过程中某个节点将根据与其右边联系的其他节点标签来决定此轮应该赋予那个标签。其基本原则为:将邻居节点的标签中出现次数最对的那个标签赋予自己,如果邻居节点的标签数目一样多,无法找出最多个数标签,则随机赋予一个标签。每个节点都根据该原则重新确定本轮中本节点应该获得的新标签,这样就完成了一轮标签复制运算。当进行了多轮运算后,绝大多数节点的标签都已经相对稳定,不再发生变化,此时就是计算的最终结果。如果图中节点具有相同的标签,那么可以认为这些节点属于同一个“团结构”。那么可以将模型中的保护信号节点化,然后使用上述方法挖掘出信号的密集连通子图,根据目前五级分类在预先定义五级告警的基础上,就可以在某个非事故信号产生时提前引起监控员重视。
三、使用标签传播算法计算信号关系图
应用标签传播算法挖掘告警信号之间的传播。标签传播算法是一个标准的图挖掘算法,[8-9]即其计算对象是有节点和节点之间的边构成的图。对于电网中的告警信号,图中的节点就是告警信号,应用上一节生成的关键字代表节点的唯一编号,节点之间的边代表告警信号之间的关联关系,考虑可以在历史数据库中设置一个时间窗口,该时间窗口的大小可设置为一次事故发生的时间长度,所有在这一时间段内出现的信号具有标签传播的分析价值,信号之间两两相连。应用Apriori算法分析出信号之间的关联关系,并通过信号的模型归属进行剪枝,去掉一些信号之间的关联关系,即S1信号告警产生,S2信号告警也将很快发生。如图3所示,两堆信号关联之间的联系由设备的拓扑关系决定。
通过信号告警,伴随历史数据的积累,可以构建一张含有大量节点的大图,对于标签传播算法来说,需要标注初始的“标签”信息,考虑监控员在日常使用中可对监视到的信号进行确定,可以要求监控员在系统前期建设中在确认信号的基础上对信号增加标识的工作内容,以便系统建设初期,即使是在信号不完善的情况下也可以借助监控员辅助将重要的、次重要、误发的告警进行分类标记,在系统完成建设后即可享受成果带来的便利性。
根据频繁项集L3可以看出,(S1,S4,S5)、(S5,S4,S2)表示信号可能同时出现,由于信号具有时间维度属性,因此标签也应当具有时间维度属性。此时这些信号中总是存在已被标签信号和未被标签的信号,希望找到信号之间的密集连通子集,应用第四节中所述的三个步骤可以实现标签的传播,直至所有的信号都具有标签,且可能出现两种情况:所有信号都共享一个标签或是在整个关联信号中有两个或两个以上的关联标签。对于共享一个标签的信号来说,这些告警信号都紧密关系,即任何一个信号出现,其余信号都有极大的可能出现,此时再遍历本密集连通子图中的其余信号,如果当中存在一类事故信号,则说明某一低等级的告警信号是事故先兆,需要监控员加强关注。
五、结论
本文讨论了电网监控信号的关联分析与重要信号“推荐”方法,主要解决在面对海量告警数据时的处理方法。以本文方法为基础,根据实际情况可以灵活扩展,只要对“标签”进行适当的研究,通过设置合理标签使其符合实际的调度监控环境。对于信号历史挖掘需要丰富的数据,在系统建设的初期需要监控员参与,当有了足够的数据积累和合理的标签后可以使信号更为智能的呈现在监控员面前。
将来,电网监控可在本文讨论的基础上进一步研究,设计一套针对电网调度监控系统的信息标签,研究出更加适合电网告警信息的搜索方法,以提高形成基本信号关联模型的速度。
参考文献:
[1]辛耀中.新世纪电网调度自动化技术发展趋势[J].电网技术,
2001,25(12):1-10.
[2]殷自力,陈杰.福建电网调控一体化运行管理模式的研究与实现[J].电力与电工,2012,(4):4-8.
[3]张瑛,孔庆伟.调控一体化信息专家处理系统探讨[J].新疆电力技术,2013,(1):10.
[4]Han J,Kaufmann M K M.Datamining:concepts and techniques[M].韩家炜,译.北京:机械工业出版社,2000.
[5]Linden G,Smith B,York J.Amazon.com recommendations:Item-to-item collaborative filtering[J].Internet Computing,IEEE,2003,7(1):76-80.
[6]ZHU Xiao-jin,GHAHRAMANI Z.Learning from labeled and unlabeled data with label propagation,CMU-CALD-02-107[R].Pittsburghers:Carnegie Mellon University,2002.
[7]杨胜春,姚建国,高宗和,等.基于调度大二次系统的智能化电网调度辅助决策的研究[J].电网技术,2006,(2).
[8]张俊林.标签传播算法在微博用户兴趣图谱的应用[J].程序员,
2012,(7).
[9]郝建柏,陈贤富,黄双福,等.一种基于模糊近邻标签传递的半监督分类算法[J].微电子学与计算机,2010,27(2):30-33.
(责任编辑:孙晴)
关键词:告警窗;标签传播算法;Apriori算法;调控一体
中图分类号:TK21 文献标识码:A 文章编号:1007-0079(2014)35-0211-03
随着国家电网公司“三集五大”[1,2]建设的深入开展,作为公司核心业务之一的“大运行”体系提出了“调度集控专业融合、调度结构优化调整”的改革方向,这就需要整合多级电网调度和变电运行资源,推进变电设备集中监控业务与电网调度运行业务的融合,实现各级调控一体化,以提高驾驭大电网的调控能力和大范围优化配置资源的能力,保障大电网的安全、经济、优质、高效运行。根据业务分工不同,监控员主要负责对设备状态监视,但海量的设备状态信号对于监控员来说并不友好,同时充斥着大量“噪声“严重影响监控员的判断。作为电网运行的重要要素,一次设备的运行状况会直接影响整个电网的安全,由于设备本身的问题造成电网故障的案例在国内外屡见不鲜。
目前在实际运用中针对监控信号的过滤、优化有延时告警、频发告警抑制等方法。这些方法对于告警信息使用经验数据来过滤多余的频发告警信息,从某种程度上讲,有效抑制了“噪声”告警信息,但“一刀切”的监控方式,对某些可能是正常频发的故障信号造成误伤,或者是某些设备异常状况却无法被监控员及时发现,耽误了最佳处理时机。与此同时,由于信号本身缺乏关联性,导致监视重点很难突出。目前调控一体系统普遍采用的策略是告警分等级[3]的方式,即在系统建设初期就将信号点按照重要程度顺序分级,监控员只需要重点关注最高等级的告警即可。从实践来讲,该方法简单有效,某种程度上固化了信号的含义,虽然能及时发现问题,但忽视了信号间的关联性,无法及时将设备故障解决在问题发生之初,从而降低了设备在电网中的故障运行风险。
本文通过分析监控员的日常使用习惯及信号特征,实现了一种较为实用的“噪声”消除方法,在目前普遍应用的五级告警分级基础上提出了一种结合“推荐系统”“频繁项”、[4,5]人工“标签”的数据挖掘算法,在设备出现异常的初期及时提醒监控员重视,通过灵活的变化确保告警,避免事故扩大化,进而控制事故蔓延。
一、调控一体化应用及调控告警信息简介
调控一体化应用(即:采用电网调度监控中心加运维操作站的管理模式),具体而言,就是电网调度与变电监控一体化设置,变电站运行管理机构分片布点。调度控制中心主要承担电网调度、变电站监控及特殊情况下紧急遥控操作等职责;运维操作站主要负责调度指令的分解、变电站刀闸操作、运行巡视等工作。
随着调度、监控业务合并到主站端,一方面解决了设备安全运行和电网安全运行的及时信息互通,合多人之力共同解决问题;另一方面由于监控员面对的监控对象由过去的某一个变电站转变为本电网公司辖区下的所有变电站,需要监视的信号数量呈几何级增加,但由于技术不成熟等多种原因造成的信号质量不佳,大幅增加了信号数量。如果对告警进行处理缺乏有效手段,那么监控对于维护电网安全运行的功效将大打折扣。
集中监控的监控员在日常工作中按责任区划分对电网公司管辖范围内的厂站分区、划片进行监视,通常的监视手段为实时告警窗和光字间隔图。综上所述,在电网,设备平稳运行的阶段,基于现在的分类方式,任何一种风格的告警窗都可以很好的配合监控员工作。但是一旦出现电网波动或是设备故障,抑或是信号误发,对于调度端来说,都会有海量信号涌入,因此,研发出一种合理的信号关联处理方法十分必要。
二、理论依据
1.现状分析
调控一体应用采用了一二次模型建模的方法,将二次设备产生的保护信号和一次设备进行了关联。各个孤立的保护信号通过一次设备建立了关联,部分无法对应到唯一的一次设备的保护信号则通过间隔进行关联,而一次设备通过拓扑建立关联关系,如图1所示为简化的设备、间隔、信号模型。[7]
目前国家电网公司对信号进行了五级分级,即一类为事故、二类为异常、三类为越限、四类为变位、五类为告知。通常一类信号产生意味着电网中已经出现了严重的事故,这类信号往往最少,而其他几类信号普遍较多,并且往往蕴含着电网事故发展的趋势,但是由于数量巨大,有用的信息经常被淹没在频繁的动作信息之中。
2.标签传播算法
标签传播算法label propagation algorithm(LPA)[6]是一种基于图的半监督学习方法,其基本思路是用已标记节点的标签信息区预测未标记节点的标签信息。利用样本间的关系建立关系完全图模型,在完全图中,节点包括已标注的和未标注的数据,节点之间的边则表示两个节点之间存在的关联关系,节点的标签按相似度传递给其他节点。
目前在社交网络分析领域中,标签传播算法被广泛采用,该算法主要用来自动挖掘社交关系中的“团结构”(通俗讲就是不同的圈子)。该算法能够广泛使用主要因为它有两个明显优点:首先,该算法思路非常直观易监测、易理解、易实现;其次,该算法机制易于实现对大规模数据处理,具有很强的实用性。对比与电网中的二次信号,两者之间的不同处在于社交网络的信息更具随机性和随意性。作为调控一体应用来说,电网中的信号则更具有规律性;两者的相同性在于针对任何一个电网设备,或是整个电网都类似于社交网络均可以将信号(包括开关信号)和设备、电网建立网络关联,进而结合信号的产生推测出信号状态在电网或是某一设备的传播,通过人工指定的某些一类事故信号,提前提醒监控员重视某些非一类信号,及早发现电网设备的事故隐患。 对一个电网络E来说,将电气设备抽象为节点,那么电网络包含若干个节点,节点之间由边相互连接。这足够抽象为一个图的结构,考察其电气属性,节点之间相互连接代表两个设备之间相互连通,那么某设备的某一信号出现异常,那么故障会首先在设备内部开始发展,如果没有保护装置的及时切除,持续发展下去就会导致整个电网出现严重故障。
对于电网E来说,应用标签传播算法自动发现其中的密集连通子图,在初始阶段可以为图中每个节点赋予一个独一无二的标签L,这个标签即为节点的初始标签值。接下来通过多轮迭代计算,通过图的边将标签向其他节点传播。在一轮迭代运算过程中某个节点将根据与其右边联系的其他节点标签来决定此轮应该赋予那个标签。其基本原则为:将邻居节点的标签中出现次数最对的那个标签赋予自己,如果邻居节点的标签数目一样多,无法找出最多个数标签,则随机赋予一个标签。每个节点都根据该原则重新确定本轮中本节点应该获得的新标签,这样就完成了一轮标签复制运算。当进行了多轮运算后,绝大多数节点的标签都已经相对稳定,不再发生变化,此时就是计算的最终结果。如果图中节点具有相同的标签,那么可以认为这些节点属于同一个“团结构”。那么可以将模型中的保护信号节点化,然后使用上述方法挖掘出信号的密集连通子图,根据目前五级分类在预先定义五级告警的基础上,就可以在某个非事故信号产生时提前引起监控员重视。
三、使用标签传播算法计算信号关系图
应用标签传播算法挖掘告警信号之间的传播。标签传播算法是一个标准的图挖掘算法,[8-9]即其计算对象是有节点和节点之间的边构成的图。对于电网中的告警信号,图中的节点就是告警信号,应用上一节生成的关键字代表节点的唯一编号,节点之间的边代表告警信号之间的关联关系,考虑可以在历史数据库中设置一个时间窗口,该时间窗口的大小可设置为一次事故发生的时间长度,所有在这一时间段内出现的信号具有标签传播的分析价值,信号之间两两相连。应用Apriori算法分析出信号之间的关联关系,并通过信号的模型归属进行剪枝,去掉一些信号之间的关联关系,即S1信号告警产生,S2信号告警也将很快发生。如图3所示,两堆信号关联之间的联系由设备的拓扑关系决定。
通过信号告警,伴随历史数据的积累,可以构建一张含有大量节点的大图,对于标签传播算法来说,需要标注初始的“标签”信息,考虑监控员在日常使用中可对监视到的信号进行确定,可以要求监控员在系统前期建设中在确认信号的基础上对信号增加标识的工作内容,以便系统建设初期,即使是在信号不完善的情况下也可以借助监控员辅助将重要的、次重要、误发的告警进行分类标记,在系统完成建设后即可享受成果带来的便利性。
根据频繁项集L3可以看出,(S1,S4,S5)、(S5,S4,S2)表示信号可能同时出现,由于信号具有时间维度属性,因此标签也应当具有时间维度属性。此时这些信号中总是存在已被标签信号和未被标签的信号,希望找到信号之间的密集连通子集,应用第四节中所述的三个步骤可以实现标签的传播,直至所有的信号都具有标签,且可能出现两种情况:所有信号都共享一个标签或是在整个关联信号中有两个或两个以上的关联标签。对于共享一个标签的信号来说,这些告警信号都紧密关系,即任何一个信号出现,其余信号都有极大的可能出现,此时再遍历本密集连通子图中的其余信号,如果当中存在一类事故信号,则说明某一低等级的告警信号是事故先兆,需要监控员加强关注。
五、结论
本文讨论了电网监控信号的关联分析与重要信号“推荐”方法,主要解决在面对海量告警数据时的处理方法。以本文方法为基础,根据实际情况可以灵活扩展,只要对“标签”进行适当的研究,通过设置合理标签使其符合实际的调度监控环境。对于信号历史挖掘需要丰富的数据,在系统建设的初期需要监控员参与,当有了足够的数据积累和合理的标签后可以使信号更为智能的呈现在监控员面前。
将来,电网监控可在本文讨论的基础上进一步研究,设计一套针对电网调度监控系统的信息标签,研究出更加适合电网告警信息的搜索方法,以提高形成基本信号关联模型的速度。
参考文献:
[1]辛耀中.新世纪电网调度自动化技术发展趋势[J].电网技术,
2001,25(12):1-10.
[2]殷自力,陈杰.福建电网调控一体化运行管理模式的研究与实现[J].电力与电工,2012,(4):4-8.
[3]张瑛,孔庆伟.调控一体化信息专家处理系统探讨[J].新疆电力技术,2013,(1):10.
[4]Han J,Kaufmann M K M.Datamining:concepts and techniques[M].韩家炜,译.北京:机械工业出版社,2000.
[5]Linden G,Smith B,York J.Amazon.com recommendations:Item-to-item collaborative filtering[J].Internet Computing,IEEE,2003,7(1):76-80.
[6]ZHU Xiao-jin,GHAHRAMANI Z.Learning from labeled and unlabeled data with label propagation,CMU-CALD-02-107[R].Pittsburghers:Carnegie Mellon University,2002.
[7]杨胜春,姚建国,高宗和,等.基于调度大二次系统的智能化电网调度辅助决策的研究[J].电网技术,2006,(2).
[8]张俊林.标签传播算法在微博用户兴趣图谱的应用[J].程序员,
2012,(7).
[9]郝建柏,陈贤富,黄双福,等.一种基于模糊近邻标签传递的半监督分类算法[J].微电子学与计算机,2010,27(2):30-33.
(责任编辑:孙晴)