大数据在供电局应用浅析

来源 :城市建设理论研究 | 被引量 : 0次 | 上传用户：koutoumonnokoro

【摘要】

：

【作者】

：

吕伟

【出处】

：

城市建设理论研究

【发表日期】

：

2014年28期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　中图分类号：F407文献标识码： A
　　
　　供电行业是传统的基础行业，负责民用、企业用电，和百姓和企业息息相关，但是一直以来供电行业都只停留在供电基础建设，各行各业都提倡以人为本，客户为中心，作为供电局怎么才能提供更好、更人性化的服务呢？在当前互联网发展飞速发展的今天，大数据作为当前最为火热的技术，是不是能在供电行业提供些帮助和思路，指导供电行业也紧跟时代更好的服务大众，使供电业也更好的信息化？
　　每个人每天，甚至每时每刻都离不开电，大到公司，小到个人，和生活息息相关。每时每刻都会产生大量的数据，这些数据有如下特点，信息量大，数据分散多样，同时也有重要指导、分析的价值。
　　数据的价值
　　这些海量的数据，每时每刻都在产生，而且多样性，但是具有统计和指导意义。
　　一、决策指导意义
　　1.行业用电统计指导
　　通过收集的这些基础数据，可以针对民用、企业用电指标进行分析，以及企业行业用电分布进行统计，这样可以对用电大、耗能高的企业提出改造建议，做好节能减排，同时便用监控、管理，对于用电高峰期的处理提出指导意见。
　　2.区域用电指导
　　在海量的用电数据的统计分析基础上，可以明显直观的查看市区不同区域的用电情况，哪些区域用电大，哪些区域用电小，用电大的地区对基础用电设施的冲击和压力有多大。
　　
　　3.时段用电指导
　　对这些基础的用电信息同时可以按照时段对数据聚合，进而分析统计，产生时段，大到年用电分布，小到每天的用电分布，便于分析年用电的高峰期和天的高峰期，便于供电局对电网的管理。
　　4.电价的指导
　　通过上面的统计分析产生了不同维度的统计数据，这些数据对于管理、运营电业的部门提供的指导意义，同时可以通过阶段电价的经济杠杆调节用电高峰期和低谷期的波形，减轻用电压力，高效利用电资源。
　　
　　二、监控预测意义
　　上面通过对基础的海量、随机数据统计分析产生了历史曲线分布数据，可以对现在和未来可以产生积极的预测功能。
　　1.企业的用电数据虽然短时间是随机波动的，但是在大一点的时段统计，数据是有规律的，而且基本上偏差幅度都在比较小的范围波动，那么如果当前的某段时间数据和历史数据出入过大，那么可以针对这些异常的波动提出预警，通过邮件或者短信的方式通知供电局管理人员，这些异常的波动往往暗示企业用电的异常情况，或者线路的异常，可以加强供电局对企业用电的监管，有效的、及时的发现问题，减少损失。
　　2.这些统计数据同时可以提供给大到企业小到个人，提供多终端的查询，例如个人用户可以使用手机随时随地查看自己用电情况，什么时间用电多，什么时候用电少，对于那些费电不节能的电器的淘汰，及时了解剩余电量，并及时购买充值提供指导意义。对于企业，企业的负责人可以更好的了解企业的用电成本，控制成本。这些服务可以让用户感觉更为直观、可信，对供电局的服务更加满意。
　　3.统计数据同时可以对未来产生积极、有效的预测功能，让供电管理部门提前做好准备工作。例如，通过分析，发现南方某城市每年从6月中旬开始用电逐渐增加，七月份达到负载高峰，可以提前通过行政手段减轻用电压力，同时可以通过经济手段调节用电，减轻用电负荷。
　　三、成本的意义
　　由于采用了现代电子和互联网技术，对于数据实时采集，也可以减少大量的人工成本，做到数据的及时可靠、完整，同时由于对这些海量数据进行了有效的数据统计和分析，用于指导工作和预警，也减少了不必要的损失和成本，对于提高利润有积极的作用。
　　NOSQL在大数据的应用
　　Nosql是相对于传统的关系型数据库而言的，两者存在许多显著的不同点，其中最重要的是NoSQL不使用SQL作为查询语言。其数据存储可以不需要固定的表格模式，也经常会避免使用SQL的JOIN操作。当代典型的关系数据库在一些数据敏感的应用中表现了糟糕的性能，例如为巨量文档建立索引，对海量数据的高效率存储和访问的需求，对数据库的高可扩展性和高可用性的需求。NoSQL 是非關系型数据存储的广义定义。它在处理海量数据有着独特的优势，nosql数据库的出现就是为了满足这一需求，它可以处理海量的数据，可以很容易的分布式的运行于价格低廉的pc机上，它的性能很好，避免了影响性能的一些操作。同时提供灵活的数据模型给松散结构数据的存储提供了便利、有效的存储方案。
　　可能会问为什么使用nosql而不采用关系型数据库呢？因为关系型数据库在海量数据面前有些力不从心，前面已经提到，它在扩分布式，高速，海量数据的处理天生就是弱项。
　　ElasticSearch是一个基于Lucene构建的开源，分布式，RESTful搜索引擎。设计用于云计算中，能够达到实时搜索，稳定，可靠，快速，安装使用方便。支持通过HTTP使用JSON进行数据索引。
　　ElasticSearch有如下特点：
　　1.集群
　　集群中有多个节点，其中有一个为主节点，这个主节点是可以通过选举产生的，主从节点是对于集群内部来说的。ElasticSearch是去中心化的，客户端与任何一个节点的通信和与整个ElasticSearch集群通信是等价的，但是在集群内部有一个选举产生的主节点。
　　2.分片
　　代表索引分片，ElasticSearch可以把一个完整的索引分成多个分片，这样的好处是可以把一个大的索引拆分成多个，分布到不同的节点上，构成分布式搜索，达到高性能的需求。分片的数量只能在索引创建前指定，并且索引创建后不能更改。
　　3.副本
　　在索引创建时，可以指定副本的数量，这样通过启动多个ElasticSearch的实例，将索引在多个ElasticSearch实例中分布索引副本，达到容灾、高可用的需求。同时由于索引分布到不同的节点中，当获取数据时，ElasticSearch集群会将请求分布到集群不同节点，达到负载均衡的目的。
　　4.恢复
　　集群节点中有节点故障退出集群，或者有新节点加入集群时，ElasticSearch会自动的对数据进行复制、恢复、自动分布。
　　5.发现
　　ElasticSearch是基于p2p协议的分布式系统，它会根据配置的集群节点名称和网络配置自动发现新加入的节点，并将新节点自动加入集群，ElasticSearch的集群是相当简单的，只需做简单的配置即可，可以降低构建分布式系统成本。
　　ElasticSearch在供电局应用浅析
　　一、系统架构
　　
　　
　　如图所示，架构分为两部分
　　1.原始基础数据涉及到硬件用电数据采集设备，接口数据服务器集群，以及数据存储的Elasticsearch的集群，这部分主要负责原始数据的采集和存储。
　　2.针对原始数据不同纬度的数据统计分析服务器，运营决策服务器等，通过web方式提供给多个部门，多个终端用户查看、使用。
　　二、基础数据收集
　　Elasticsearch是支持单条数据添加、更新的，考虑到电业局的具体情况，数据量比较大，多采集终端采集数据，以及性能问题，我们采取将采集的数据放入队列，再将队列中的数据批量，分次的导入到elasticsearch中，elasticsearch提供了批量数据的插入api，我们使用java客户端，批量插入的方式如下
　　BulkRequestBuilder bulkRequest = client.prepareBulk();
　　bulkRequest.add(client.prepareIndex("index", "type", "id")
　　.setSource( dataJSONStr )
　　);
　　......
　　bulkRequest.add(client.prepareIndex("index", "type", "id")
　　.setSource( dataJSONStr )
　　);
　　BulkResponse bulkResponse = bulkRequest.execute().actionGet();
　　
　　通过这样的方式可以高效的存储用电数据，构建基础的数据仓库。
　　三、基础数据的统计、分析
　　针对上面收集到的数据结合电业局的具体使用，可以通过下面数据进行分析。
　　1.基于数据的地理位置分析
　　2.基于数据的来源，是民用还是企业，企业的性质
　　3.基于数据的时间分析
　　4.针对单一的企业用户的时间维度的分析
　　
　　针对上面的需求分析，我们可以定义基础的实体结构
　　
　　elasticsearch提供对数据统计分析的功能有facets和aggregations两种方式，在elasticsearch的1.0版本开始支持新的统计方式，即Aggregations方式，可以提供min、max、sum、avg、histogram等等新的统计方式。下面给出针对上面所说的四种分析方式elasticsearch的简易实现方式。
　　1.针对地理位置的统计分析，可以按照分析的实际分析维度需要进行分析，下面给出一个小时时间段的针对地理位置的java客户端实现代码。
　　//获取搜索请求
　　SearchRequestBuilder sb = SearchUtils.getDefaultSearchRequestBuilder( esClient, index, type_access_base);
　　//建立区间过滤
　　RangeFilterBuilder rf = new RangeFilterBuilder("createDate");
　　rf.gte(startStr);
　　rf.lt(end);
　　sb.addAggregation(AggregationBuilders
　　 .filter("rangFilter")
　　 .filter(rf)
　　 .subAggregation(
　　 AggregationBuilders
　　 .terms("addrTerm")
　　 .field("addr")));
　　SearchResponse response = sb.execute().actionGet();
　　//对查询数据结果获取需要的数据
　　Aggregations aggrs = response.getAggregations();
　　InternalAggregations in = ag.getAggregations();
　　StringTerms st = in.get("addrTerm");
　　for (Bucket bt : st.getBuckets()) {
　　 Map map = new HashMap<>();
　　 map.put("addr", bt.getKey());
　　 map.put("addrCount", bt.getDocCount());
　　}
　　通過上面的代码即可获取到某一时段的不同区域的数据统计的结果，可能有人说用关系型数据库也可而且比这个还方便，为什么用elasticsearch呢？答案是，当数据比较少比如几百万的情况下，他们是可以的，但是在几十亿数据的条件下，他们就不行了，做一个聚合有可能需要的时间是难以想象和忍受的。
　　2.针对数据来源的统计，可以将上面的代码统计的字段改为来源的字段即可，即.field("addr")中的addr修改为需要的字段即可
　　3.针对时间的统计分析可以使用facets，facets提供一个 histogram facets的方式，可以设置不同的时间间隔对指定字段进行聚合统计。下面由于篇幅原因就不给出java客户端实现方式，给出rest的调用方式
　　{"query" : {
　　"match_all" : {}
　　 },
　　"facets" : {
　　 "histo1" : {
　　"histogram" : {
　　"field" : "field_name",
　　"time_interval" : "1.5h"
　　 }
　　}
　　 }
　　}
　　其中field指定需要统计的字段名称，time_interval指定时间间隔，可以是小时，天，更多参数请参见官方文档。
　　4.针对单一企业用户可以首先对数据过滤然后对过滤的数据进行histogram facets的统计聚合。
　　
　　大数据在供电局中使用的展望
　　
　　数据的积累就是原始的财富的积累，通过在这些数据的分析可以产生很多实际的有价值的东西，避免凭直觉和经验判断、做事。做到真正的有数据支撑，有效准确的决策支撑。
　　通过对数据的分析可以为家庭用户提供更好的服务，更方便的用户进行自助服务，提供信息化的渠道，减少供电局不必要的人力成本。
　　同时可以针对行业，提供行业云解决方案，更好的推进全局的信息化和云建设。

其他文献

对建设工程中桩基施工技术的再研究

摘要：在建筑工程建设的过程中，桩基施工是整个建筑施工过程打基础的环节，也是最重要的一项任务。本文就针对建设工程中桩基施工技术进行研究分析，从而可以保证建筑工程的建设质量。　　关键词：建设工程；桩基基础；施工技术　　中图分类号：TU74文献标识码： A 　　引言　　良好的桩基基础是建筑工程安全稳定的前提，也是建筑工程质量的保证。桩基基础具有安全高效、施工效果好等优点，在节约资金，提高经济效益方面有着

期刊

电厂热工控制系统的故障诊断研究

【摘要】：火力发电厂热工自动化控制系统是一个相对复杂且功能性较强的控制系统,其主要功能是为了保障设备的安全性能,提高发电机组的经济效益,并且能够减少劳动力改善劳动条件。近年来随着科学技术和计算机的发展,电厂热工自动化控制系统的水平显著提高,在追求良好控制性能的同时, 降低电厂热工控制系统故障发生率，使电网能够高效、稳定输送电能具有十分重要的现实意义。　　【关键词】：电厂；热工控制系统；故障诊断

期刊

从长城脚下的竹屋看隈研吾的建筑设计思想

摘要:隈研吾，日本新生代建筑师，在日本和巴黎设有建筑事务所,在世界各地均有重要的建筑设计项目。隈研吾一直主张设计的一切都要与自然相结合，在他的设计中建筑与环境的关系是首位的，在大家都希望在环境中突显自己的建筑时，隈研吾力求消隐他的建筑。建筑通过弱化自己的形式感，来融入周围场所也就是环境，以期与人、环境三者之间达到一种平衡和谐的关系。当前中国建筑师也面临建筑如何与自然共存以及同时继承本国传统文化，使

期刊

发电厂锅炉相关经济调整分析

摘要：锅炉是火力发电厂主机之一，其运行调节直接关系到机组安全运行以及整个机组的经济性。从锅炉的运行原理进行分析入手，进一步总结煤粉锅炉和CFB锅炉运行调节的方式以及需要注意的细节，从而为从事火力发电厂电站锅炉运行的运行调节提供一定的借鉴。　　关键词：发电厂;锅炉运行;调整分　　中图分类号：F407文献标识码： A　　Analysis of power plant boiler related e

期刊

地下结构防水与抗浮设计的解析

摘要：随着城市不断发展，地面建筑的日益增加，但地面空间越来越狭小，越来越多的建筑往地下发展成为一种趋势。所以对地下建筑结构的设计有着比地面设计更为特殊的要求。地下室结构的防水与抗浮问题关系着建筑质量及其穩定性，所以在材料选用上必须多加关注，以减少地下建筑结构施工过程中的安全隐患，提高整座建筑的质量，增强建筑的稳定性。　　关键词：地下结构；防水设计；抗浮设计；对策　　中图分类号：S611文献标识码

期刊

防水施工路基面处理工艺与设备

摘要：道桥建设施工完毕后，为了提高道桥的使用年限，加强道桥使用的安全性能，需要进行防水项目的施工处理，该项施工如果没有先进的施工工艺和设备支撑，则会影响道桥路面的质量。基于此，切实提高施工单位对防水施工路基面处理的认识，改善工艺，引进设备十分有必要。　　关键词：防水施工；路基面；工艺设备　　中图分类号：TM305文献标识码： A　　引言　　现在，道桥施工中常常存在着这样的问题，桥面出现了破损和缝隙

期刊

房建工程施工全过程管理的研究

摘要：随着建筑行业的不断发展，工程项目全阶段的成本控制在建筑行业的发展中有着相对重要的地位。本文就目前房建工程全阶段造价成本控制进行了细致的分析，探讨如何做好房建工程的成本控制工作，推动房建工程项目全阶段成本控制水平得到有效的提高。　　关键词：房建工程造价全过程成本控制　　中图分类号： TU723 文献标识码： A　　前言　　随着社会经济水平的不断提高，越来越多的房屋建筑逐渐兴起。现今，在我

期刊

防火疏散设计在建筑设计中的作用

摘要：建筑工程消防安全一直是建筑工程设计中非常重要的环节，一旦建筑工程发生火灾，不仅会造成重大的财产损失，还会导致人员伤亡，对社会的影响十分不利。建筑工程发生火灾，要进行有序的安全疏散，将损失降到最低限度。尽管我国在一些建筑工程设计的防火规范中对安全疏散设计有所规定，但建筑工程消防安全疏散设计尚未真正与实际相结合。建筑消防安全疏散设计有助于减少火灾造成的危害，提高建筑工程的使用价值，促进建筑行业的

期刊

房建工程造价管理存在的问题及对策

摘要：随着城市化建设步伐的加快，建筑行业得到了迅猛发展，房屋建筑工程项目越来越多。本文阐述了建筑工程造价管理的特点，针对房屋建筑工程造价管理中存在的问题，提出了加强房屋建筑工程造价管理及控制的有效措施探究。　　关键词：房屋建筑；工程造价；管理　　中图分类号： TU723 文献标识码： A　　引言　　随着我国国民经济的快速发展，建筑行业也得到了前所未有的发展，房地产市场竞争也变得更加激烈。在相同的开

期刊

大跨度梁吊杆悬挂结构施工

摘要：随科技的进步，建筑外形越来越独特，结构也随着空间使用功能越来越新颖。建筑在造型上的不断创新,空间构成的变化,使得结构设计理念发生了重大变革,特别是中庭空间的出现和底部空间的变化对结构的实现提出了更高的要求,要求结构形式不断创新。本文结合山东省会文化艺术中心三馆工程的设计、施工针对大跨度梁吊杆悬挂结构施工进行了阐述，以供大家参考交流。　　　　关键词：预拼装、刘扬支架、拔杆、栓焊连接、焊缝无损检

期刊

大数据在供电局应用浅析

其他学术论文