自主计算的自优化问题研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:zhangwenda_gz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决软件复杂性危机,学术界和产业界提出了自主计算的概念.自主计算的核心是使计算机系统具有自管理能力,包括自配置、自优化、自恢复和自保护.虽然自主计算描述了美好的蓝图,但是它不仅面临巨大的工程挑战,而且面临很多科学难题.自主计算对学习和优化理论提出了新的挑战.本文从理论上研究自主计算的自优化问题,这个问题目前还比较少研究.复杂自主系统的优化不是单个目标的优化,而是多个目标的同时优化,这样才能达到整体性能最优.因此研究多目标优化是提高自主系统的自优化能力的重要方面.自主环境是由很多主体构成的动态变化的复杂系统.因此动态环境中优化是自主计算亟需解决的问题.本文从两方面深入研究了自主计算中的自优化问题:利用进化计算的方法研究多目标优化问题;利用强化学习研究动态环境中的优化问题.本文的研究工作主要有以下几个方面: 提出了新颖的数据结构一占优树,以减少多目标优化进化算法中适应值指派的时间复杂度.占优树是能保存三值比较关系的二叉树.我们系统提出了占优树的定义、算法、性质以及算法的时间复杂度.根据占优树的有用特性,我们将它应用进化多目标优化的两个方面:基于占优树的适应值指派方法;基于占优树的多目标进化算法.性能和效率两方面的实验表明基于占优树的算法能够产生比SPEA2和NSGA-II有竞争力的解,但是该算法比它们要快得多.针对基于占优树的多目标进化算法中存在的缺乏密度估计和固定的种群大小的缺点,我们进行了相应的改进.实验结果表明改进算法明显优于原先的算法. 提出了应用于多目标优化的多主体协作系统.针对现实世界广泛存在的多目标优化问题,我们分析其中有三类主体:规划主体规划全局最大利益,行为主体规划单个目标的最大利益,资源主体管理公共资源.我们将进化多目标优化的算法流程应用于多主体协作过程.该方法实现了进化多目标优化的分布并行计算.种群作为资源主体中的资源,行为主体评价单个目标的适应值,规划主体的全局优化是个体的排序过程.这三类主体合作达到Pareto最优解.模拟实验证实该方法是有效的. 提出了单向值方法自动找到子目标.基于option的分层强化学习的关键问题在于学习过程中如何自动找到子目标,我们提出了子目标的有效动作受限的启发式策略.根据这个策略,寻找子目标的问题转化为寻找路径中最匹配的动作受限状态.针对网格环境的学习任务,利用动作受限特性,我们设计了单向值方法自动找到子目标.我们将该方法进行了两方面的应用:离线和在线自动寻找option.实验表明不管是离线还是在线方法,基于单向值方法找到的option的Q学习比基本的Q学习方法要快得多.提出了共享经验的多主体强化学习.我们通过猎人围捕问题深入研究了共享经验对多主体强化学习的学习速度的影响.我们提出了三种状态空间的表示方法:以猎人为中心的建立独立的状态空间;以猎物为中心的建立共享的状态空间以及利用问题的对称性进一步将状态空间压缩到第一象限.通过实验发现共享的状态空间加快了学习的速度;状态空间越小,学习速度也越快. 基于上述研究,本文最后对自主计算的自优化问题研究进行了讨论和总结,并指出了未来的工作方向.
其他文献
部件化网络内存是网格化动态自组织体系结构(DSAG)研究的一个重要的部分.单纯的软件原型或硬件原型系统分别在系统性能、稳定性、可扩展性、开发周期等方面存在不足.随着对网
随着半导体工艺技术的不断进步,芯片的设计规模越来越大,特别是进入深亚微米以后,集成电路完全可以将一个完整的电子系统在单块芯片上实现,于是便出现了片上系统(System on C
随着集成电路工艺特征尺寸的不断减小,以及大型计算机和消费类电子产品对于高性能和低功耗的不断需求,超大规模集成电路(VLSI)设计向着高速、低功耗的方向努力.这种情况下,芯
资源空间模型是知识网格理论的核心模型之一,用于规范、管理和共享资源,是一种基于分类语义的数据模型.资源使用机制是主要阐述如何在资源空间中管理和使用资源的机制. 本
学位
消防监督检查是指各级消防监督机构依法对建筑物遵守消防法律、法规情况进行的监督检查,对违反消防法律、法规的行为,责令改正,并依法实施处罚.通过消防监督检查,消防监督机
由于存储器和处理器速度差距的日益增大,访存延迟已经成为限制程序性能的主要瓶颈.数据预取通过提前将数据取入缓存,可以掩盖访存延迟,对于提高程序性能有很大的帮助.本文以O
数值型数据是信息领域中非常重要的数据,广泛应用于商业经济、地理环境、社会资源以及科学实验等各个领域。科学数据库广泛存在数值型数据,主要集中在中国自然资源数据库,覆盖水
学位
流感是人类历史上最重要的流行病之一,给人类牛命健康带来了很大的灾难,尤其2003年以来高致病性禽流感H5N1的频繁爆发使得流感病毒的研究再次成为热点.流感测序序列日益增加,
动态电压调度(Dynamic Voltage Scaling,DVS)是一种有效的分布式嵌入式系统的系统级低功耗技术.这种技术通过降低系统中的处理部件的频率和电压,使得处理部件的功率显著下降,