基于吉布斯抽样和监督学习技术的分布估计算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:xufuen2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分布估计算法是进化计算领域新兴起的一种算法,是智能优化算法和统计学习的有机结合。分布估计算法根据父代种群中的优选个体的整体信息建立概率分布模型来描述问题解空间的分布,然后通过对概率模型随机采样产生子代种群,如此反复进行,实现种群的进化。分布估计算法通过建立概率模型描述变量之间的相关关系,能更有效地发现并重组建筑块,能够解决传统遗传算法难以解决的问题。  分布估计算法求解问题的核心是建立一个能恰当反映优选后父代种群分布的概率模型,然而,传统分布估计算法使用图论模型来描述各变量相互依赖的方式很难处理复杂的依赖关系以及高维问题。为了解决这个问题,本文提出了一种新型的概率模型,从结构、采样、学习三个方面详细阐述了该模型的工作原理,并对使用该模型的分布估计算法进行了计算机实验仿真。本文的主要内容包括以下几个部分:  1.指出传统分布估计算法所面临的困难的核心在于问题维度的限制和分布学习的无监督性,从而放弃了传统分布估计算法使用图论模型来描述依赖关系的方式,提出一种新型的概率模型,即CGS模型,该模型使用一个条件概率分布的集合来隐式的表示一组随机变量的联合概率分布,其中集合中的每一个元素分别描述了一个变量相对于其他变量的条件概率分布。  2.介绍了吉布斯抽样技术的理论基础和实现流程,阐述了如何使用吉布斯抽样技术来为CGS模型实现抽样过程,从而通过模型来产生子代种群。随后提出了抽样算法的收敛条件并予以了证明。  3.定义了损失最小化分类算法的概念,并提出一个学习算法框架,能够充分利用监督学习领域中存在的大量的损失最小化分类算法来来实现CGS模型的学习过程,从而析取优选后的父代种群的特征来生成概率分布模型。
其他文献
相变随机存储器(Phase-Change Random Access Memory, PCRAM)具有非易失性、元件尺寸小、功耗低、循环寿命长、工作速度快、可实现多位存储、抗辐射功能以及能和现在的集成电路
以大规模、多色、单光子、甚长波等为标志的第三代HgCdTe红外焦平面探测器在2000年后得到了迅速的发展,在军事、遥感、空间科学探测等领域发挥了极其重要的作用。然而,当传统的
提起“房子”,中国老百姓都会心头一热。因为对房子,他们有着太多特殊的情感,它不仅是居住的建筑,更是家的表征。随着科技的进步,计算机和电器产业都得到迅猛的发展,人民在生活水平
线粒体是细胞能量代谢必需的细胞器,也是活性氧(ROS)的主要产生部位。已知ROS可以导致多种疾病,包括代谢相关疾病,心血管疾病以及神经退行性疾病,但是越来越多的证据表明,ROS也是
空间照明系统作为空间载人航天系统中一个重要的子系统,对航天员的工作和生活有着重要的作用,为航天员提供绿色、健康的可调光照明系统也成为空间照明未来的发展方向。LED以其
先天性心脏缺陷是胚胎致畸的主要原因之一,新生儿中约有1%有先天性心脏缺陷。影响胚胎心脏发育的因素很多,最近数年的研究也揭示了一些遗传方面的潜在原因,但其遗传机制仍并不十
硫系元素过饱和掺杂单晶硅的宽光谱高吸收特性,使其在红外探测、红外成像、集成光通信和光伏领域具有潜在应用价值,成为当前硅基光电子器件的研究热点。然而,激光微织构的黑硅,其
硅基MEMS传感器已发展了半个多世纪,但即使在的商业化最为成功的压力、惯性传感器领域,仍有一些尚未解决的难题。超低量程的微差压传感器,此前仍不能同时实现低成本和高性能;超
TD-SCDMA(Time Division-Synchronous Code Division Multiple Access、时分同步码分多址)是具有中国自主知识产权的、在国际上被广泛接受和认可的,且在市场上被广泛使用的第
重金属是一类重要的环境污染物,具有难降解、易积累、高毒性并且毒性长期持续的特点。重金属污染对环境和人类健康的带来越来越严重的危害。本论文针对水环境中铅离子(Pb2+)的