论文部分内容阅读
分布估计算法是进化计算领域新兴起的一种算法,是智能优化算法和统计学习的有机结合。分布估计算法根据父代种群中的优选个体的整体信息建立概率分布模型来描述问题解空间的分布,然后通过对概率模型随机采样产生子代种群,如此反复进行,实现种群的进化。分布估计算法通过建立概率模型描述变量之间的相关关系,能更有效地发现并重组建筑块,能够解决传统遗传算法难以解决的问题。 分布估计算法求解问题的核心是建立一个能恰当反映优选后父代种群分布的概率模型,然而,传统分布估计算法使用图论模型来描述各变量相互依赖的方式很难处理复杂的依赖关系以及高维问题。为了解决这个问题,本文提出了一种新型的概率模型,从结构、采样、学习三个方面详细阐述了该模型的工作原理,并对使用该模型的分布估计算法进行了计算机实验仿真。本文的主要内容包括以下几个部分: 1.指出传统分布估计算法所面临的困难的核心在于问题维度的限制和分布学习的无监督性,从而放弃了传统分布估计算法使用图论模型来描述依赖关系的方式,提出一种新型的概率模型,即CGS模型,该模型使用一个条件概率分布的集合来隐式的表示一组随机变量的联合概率分布,其中集合中的每一个元素分别描述了一个变量相对于其他变量的条件概率分布。 2.介绍了吉布斯抽样技术的理论基础和实现流程,阐述了如何使用吉布斯抽样技术来为CGS模型实现抽样过程,从而通过模型来产生子代种群。随后提出了抽样算法的收敛条件并予以了证明。 3.定义了损失最小化分类算法的概念,并提出一个学习算法框架,能够充分利用监督学习领域中存在的大量的损失最小化分类算法来来实现CGS模型的学习过程,从而析取优选后的父代种群的特征来生成概率分布模型。