基于Spark平台和并行随机森林回归算法的短期电力负荷预测

来源 :电力建设 | 被引量 : 0次 | 上传用户:tonyyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能电网、全球能源互联网的建设与相关技术的发展,现代电力系统中电力大数据的格局已经形成,如何对高维海量数据进行深度挖掘以实现数据的充分利用,成为当前电力工作者们关心的问题。该文针对电力大数据环境下高精度和实时性的负荷预测展开了研究,提出了基于Spark平台和并行随机森林回归算法(Spark platform and parallel random forest regression,SP-RFR)的短期电力负荷预测方法,通过3次弹性分布式数据集(resilient distributed datasets,RDD)转换实现单机随机森林算法的并行化改进,并在Spark分布式集群环境下实现部署。结合某区域实际电力负荷数据设计试验,进行模型训练和回归预测,通过试验证明,对同等的数据集,基于Spark平台的并行随机森林回归算法预测精度高于单机负荷预测算法;并行随机森林算法受离群数据干扰较小,且随着数据集的增大,并行随机森林算法表现出良好的鲁棒性;与单机算法在运行时间上相比,随着数据集的增大,基于分布式集群的方法优势明显。该文提出的方法能够有效地在分布式环境中进行电力负荷预测,为负荷预测提供了一种新思路。
其他文献
<正>课堂是实施课程改革的主阵地,鲜活的课例是教师研究的主要对象。教学实践中,采用一人同课多轮、多人同课异构(同构)以及跟踪听课等形式加强课例研
新课程改革以来,阅读教学"教什么"的问题一直是语文教学界讨论的热点问题,基于学情分析视角确定教学内容的观点和做法已引起教育研究者和一线教师的关注。文章尝试运用学情分
针对电力大数据清洗过程中的提取统一异常检测模式困难、异常数据修正连续性及准确性低下等问题,提出了一种基于Spark框架的电力大数据清洗模型。首先基于改进CURE聚类算法获
<正>在长达100多年的时间里,美国的企业长期受到权威管理专家的影响。这种格局始于19世纪90年代末弗雷德里克·温斯洛·泰勒所教授的科学管理理论,发展至1917年亨利·福特为
戏剧为基础的教育,作为一种新型的教学形式是一个成功的突破,在教育领域,尤其对小学学习,如语言教学课程在初级阶段。它强调学生的表现和学习,并结合不同的方法提出戏剧研究
<正>芳草明师——王丽颖从情境教学到戏剧教学,王老师不断潜心研究,着力于以戏剧教学为途径发展学生的综合语言运用能力。学校于2012年9月开始进行《芳草课程体系建构与实施
介绍了安徽省某厂采用HDS工艺处理酸性废水的工艺流程及主要设计参数,并对运行效果进行了分析总结.结果表明,该工艺调节废水pH值和去除Al3+、SO42-离子效果好,出水水质能满足
基于信号传递理论研究了行业竞争程度对企业社会责任信息披露的影响。通过分析中国上市公司社会责任信息披露情况,研究发现:(1)企业所处行业竞争程度越高,越可能将披露社会责
基于胜任力模型基本理论,以高校中层管理者为研究对象,通过编制胜任力特征指标问卷,将调查结果进行统计分析,得出高校中层管理者胜任力六个维度,分别是个人素养、领导能力、
随着社会主义市场经济的快速发展和国家对事业单位的改革,预示着一些事业单位面临着巨大的挑战,要投入到市场经济环境中直面竞争日益激烈的完全开放的市场环境。而对于业务类