论文部分内容阅读
摘要:利用单一预测模型进行产量预测时,由于各模型的数学原理不同,对同一数据的处理只能基于数据的部分特征,在预测时无法深度挖掘数据的潜在规律,易出现较大的预测偏差。基于以上问题,笔者以1978—2017年陕西省苹果产量数据为研究对象,将1978—2012年产量作为预测模型的训练数据,2013—2017年产量作为测试数据,选取BP神经网络、ARIMA、LS-SVM 3种在数学原理上具有明显差异的预测模型,采用集成预测策略,依据3种预测模型对训练数据的平均相对预测误差确定各模型的预测权重,最终对各模型预测的2013—2017年数据进行加权获取集成预测值。实证分析表明,集成预测值的平均相对误差在2.5%以内,其预测结果比单一预测模型更加准确和稳健,可有效实现苹果产量高精度预测。
关键词:BP神经网络;ARIMA;LS-SVM;陕西苹果产量;集成预测
中图分类号: S11 9文献标志码: A
文章编号:1002-1302(2020)04-0294-07
收稿日期:2019-07-30
基金项目:国家社会科学基金(编号:18FGL022);教育部哲学社会科学研究后期资助项目(编号:18JHQ082);陕西省科技厅重大项目(编号:2018ZDXM-GY-188);陕西省社会科学界2019年重大理论与现实问题研究项目(编号:2019TJ038);陕西高校青年创新团队;西安市科技计划[编号:201806117YF05NC13(5)]。
作者简介:李鹏飞(1975—),男,陕西户县人,教授,硕士生导师,主要从事电商大数据分析研究。E-mail:lpf@xupt.edu.cn。
通信作者:毋建宏,副教授,主要从事大数据处理研究。E-mail:wujh@xupt.edu.cn。
陕西省因独特的地理优势,已成为中国苹果产区中唯一符合7项气象指标的苹果生产最适宜区。苹果产业是陕西省农业特色的优势产业,不仅是陕西省农业经济的重要支柱之一,也是农民收入的重要来源[1]。2017年,陕西省苹果产量达到1 153.94万t,约占中国苹果总产量的1/4,世界苹果总产量的1/7。苹果产业已成为全国农业结构调整的典范,因而构建符合产量变化趋势的预测模型,合理准确预测苹果产量,对指导陕西省乃至全国苹果产业具有重要的理论价值和实际意义。
随着现代预测理论的发展,传统的BP神经网络[2]、ARIMA模型[3]和支持向量机回归模型[4]已难以满足当今研究需求。众多学者将单一预测方法的组合预测模型作为研究重点,如ARIMA和BP神经网络组合[5];经验模态分解、主成分分析和人工神经网络组合[6];季节调整法和BP神经网络组合[7];EGA算法和灰色Verhulst计量组合[8]等。也有部分学者基于模型预测性能的优劣,将具有优势互补的单一模型进行集成,如将定量与定性预测相结合的集成预测模型(SIF)[9];经验模态分解和支持向量机集成[10];灰色GM(1,1)、ARIMA和VAR集成[11]等,集成预测模型克服了单一模型预测的缺陷,提高了预测精度。
为深度挖掘陕西省苹果产量潜在的变化规律,同时多原理、多角度地预测苹果产量,本研究选取BP神经网络、ARIMA和LS-SVM模型3种在数学原理上差异较大的模型作为预测模型,由于3种模型对中短期预测效果较好,将1978—2012年数据作为训练数据,而2013—2017年5年数据作为测试数据,采用MATLAB软件,对其进行拟合和测试,然后根据3种预测模型训练值的相对误差,计算出各模型的平均相对误差,并按照权重计算公式确定单一预测模型的权重,最后将加权的结果作为最终的集成预测值。
1
关键词:BP神经网络;ARIMA;LS-SVM;陕西苹果产量;集成预测
中图分类号: S11 9文献标志码: A
文章编号:1002-1302(2020)04-0294-07
收稿日期:2019-07-30
基金项目:国家社会科学基金(编号:18FGL022);教育部哲学社会科学研究后期资助项目(编号:18JHQ082);陕西省科技厅重大项目(编号:2018ZDXM-GY-188);陕西省社会科学界2019年重大理论与现实问题研究项目(编号:2019TJ038);陕西高校青年创新团队;西安市科技计划[编号:201806117YF05NC13(5)]。
作者简介:李鹏飞(1975—),男,陕西户县人,教授,硕士生导师,主要从事电商大数据分析研究。E-mail:lpf@xupt.edu.cn。
通信作者:毋建宏,副教授,主要从事大数据处理研究。E-mail:wujh@xupt.edu.cn。
陕西省因独特的地理优势,已成为中国苹果产区中唯一符合7项气象指标的苹果生产最适宜区。苹果产业是陕西省农业特色的优势产业,不仅是陕西省农业经济的重要支柱之一,也是农民收入的重要来源[1]。2017年,陕西省苹果产量达到1 153.94万t,约占中国苹果总产量的1/4,世界苹果总产量的1/7。苹果产业已成为全国农业结构调整的典范,因而构建符合产量变化趋势的预测模型,合理准确预测苹果产量,对指导陕西省乃至全国苹果产业具有重要的理论价值和实际意义。
随着现代预测理论的发展,传统的BP神经网络[2]、ARIMA模型[3]和支持向量机回归模型[4]已难以满足当今研究需求。众多学者将单一预测方法的组合预测模型作为研究重点,如ARIMA和BP神经网络组合[5];经验模态分解、主成分分析和人工神经网络组合[6];季节调整法和BP神经网络组合[7];EGA算法和灰色Verhulst计量组合[8]等。也有部分学者基于模型预测性能的优劣,将具有优势互补的单一模型进行集成,如将定量与定性预测相结合的集成预测模型(SIF)[9];经验模态分解和支持向量机集成[10];灰色GM(1,1)、ARIMA和VAR集成[11]等,集成预测模型克服了单一模型预测的缺陷,提高了预测精度。
为深度挖掘陕西省苹果产量潜在的变化规律,同时多原理、多角度地预测苹果产量,本研究选取BP神经网络、ARIMA和LS-SVM模型3种在数学原理上差异较大的模型作为预测模型,由于3种模型对中短期预测效果较好,将1978—2012年数据作为训练数据,而2013—2017年5年数据作为测试数据,采用MATLAB软件,对其进行拟合和测试,然后根据3种预测模型训练值的相对误差,计算出各模型的平均相对误差,并按照权重计算公式确定单一预测模型的权重,最后将加权的结果作为最终的集成预测值。
1