论文部分内容阅读
集成学习在解决时间序列预测问题方面显示出强大的优势,如何从集成系统中选择合适的基学习器集合是集成剪枝技术中需要研究的问题,适当的集成剪枝可以使模型的预测能力更强。集成剪枝可以有效克服传统集成学习的一些缺点,例如相对较高的时间和空间复杂性。然而,每个基学习器都有其独特的预测能力。一个基学习器可能在某些样本上表现不佳,但在其他样本上表现出色,盲目低估特定基学习器的作用是不合理的。为每个待预测样本选择最佳基学习器集合正是动态集成剪枝技术所要解决的问题。
本文提出了两种适合解决时间序列预测问题的模型。第一个模型是一种融合动态集成剪枝(Dynamic Ensemble Pruning, DEP)技术、增量学习(Incremental Learning)和核密度估计(Kernel Density Estimation, KDE)的混合式时间序列预测算法。它根据所有基学习器对待预测样本的预测值的核密度分布动态地选择合适的基学习器集合。同时,由于时间序列预测问题的特殊性,即样本按时间顺序依次被输入模型,因此动态集成剪枝和增量学习的思想被纳入算法中。该算法分为三个子过程:1)初始化,生成集成学习系统;2)集成剪枝;3)增量学习。
第二个模型是基于元学习(Meta-Learning)的动态集成剪枝算法。元学习通过重新学习预测结果来获得元预测器,并使用该元预测器来衡量基学习器是否具有预测待预测样本的能力并由此达到提高预测性能的目的。本文提出了一种基于元学习的时间序列预测算法。同时,采用三种启发式优化算法对算法的参数进行优化,分别是遗传算法(GA),粒子群优化(PSO)算法和人工鱼群算法(AFSA)。该算法可以分为三个阶段:1)集成系统初始化;2)元预测器训练和 3)预测。第一阶段,算法执行集成系统的初始化。在第二阶段,该算法训练得到一个元预测器以预测基学习器是否有能力预测样本。最后阶段中,将经过训练得到的元预测器应用于测试集,以获得最终的泛化误差。
我们将提出的两种算法在多个时间序列数据集上与多个现有的优秀时间序列预测算法作了对比实验。实验结果表明提出的两种算法总体上而言预测性能显著优于其他对比算法,显示了提出的两种算法适用于解决时间序列预测问题。
本文提出了两种适合解决时间序列预测问题的模型。第一个模型是一种融合动态集成剪枝(Dynamic Ensemble Pruning, DEP)技术、增量学习(Incremental Learning)和核密度估计(Kernel Density Estimation, KDE)的混合式时间序列预测算法。它根据所有基学习器对待预测样本的预测值的核密度分布动态地选择合适的基学习器集合。同时,由于时间序列预测问题的特殊性,即样本按时间顺序依次被输入模型,因此动态集成剪枝和增量学习的思想被纳入算法中。该算法分为三个子过程:1)初始化,生成集成学习系统;2)集成剪枝;3)增量学习。
第二个模型是基于元学习(Meta-Learning)的动态集成剪枝算法。元学习通过重新学习预测结果来获得元预测器,并使用该元预测器来衡量基学习器是否具有预测待预测样本的能力并由此达到提高预测性能的目的。本文提出了一种基于元学习的时间序列预测算法。同时,采用三种启发式优化算法对算法的参数进行优化,分别是遗传算法(GA),粒子群优化(PSO)算法和人工鱼群算法(AFSA)。该算法可以分为三个阶段:1)集成系统初始化;2)元预测器训练和 3)预测。第一阶段,算法执行集成系统的初始化。在第二阶段,该算法训练得到一个元预测器以预测基学习器是否有能力预测样本。最后阶段中,将经过训练得到的元预测器应用于测试集,以获得最终的泛化误差。
我们将提出的两种算法在多个时间序列数据集上与多个现有的优秀时间序列预测算法作了对比实验。实验结果表明提出的两种算法总体上而言预测性能显著优于其他对比算法,显示了提出的两种算法适用于解决时间序列预测问题。